4 回答

TA貢獻1818條經(jīng)驗 獲得超3個贊
java中利用HtmlAgilityPack API就可以把html解析成xml了。
在HtmlAgilityPack中常用到的類有HtmlDocument、HtmlNodeCollection、
HtmlNode和HtmlWeb等。
其流程一般是先獲取HTML,這個可以通過HtmlDocument的Load()或LoadHtml()來加載靜態(tài)內(nèi)容,或者也可以HtmlWeb的Get()或Load()方法來加載網(wǎng)絡(luò)上的URL對應(yīng)的HTML。
得到了HtmlDocument的實例之后,就可以用HtmlDocument的DocumentNode屬性,這是整個HTML文檔的根節(jié)點,它本身也是一個HtmlNode,然后就可以利用HtmlNode的SelectNodes()方法返回多個HtmlNode的集合對象HtmlNodeCollection,也可以利用HtmlNode的SelectSingleNode()方法返回單個HtmlNode。
HtmlAgilityPack確實是一個功能強大、體積小的開源HTML解析類庫,在本篇僅僅是介紹了其中幾個類的用法,但光這些就足以供周公快速實現(xiàn)了許久沒有實現(xiàn)的功能,如果讓周公用正則表達式來實現(xiàn)類似的功能,時間肯定要比用這個長得多。

TA貢獻1785條經(jīng)驗 獲得超4個贊
先把你要轉(zhuǎn)換的文件放到我的電腦!就我的文檔C吧(比如)。然后點文檔C,再點“文件夾”上的“工具”。點“文件夾選項(O)”再點上面的“查看”然后點“隱藏受保護的操作系統(tǒng)文件”最后把你要換的文件名稱最后的字不是格式嗎(HTML,什么的)把原先刪掉,換成你要的比如XML就行了,不過不是每個文件都適合任何格式的。
添加回答
舉報