import ( "fmt" "gopkg.in/xmlpath.v2" "log")...path := xmlpath.MustCompile("//div[@id='23']")tree, err := xmlpath.ParseHTML(reader)if err != nil { log.Fatal("HTML parsing error, maybe not wellformed", err)}iter := path.Iter(tree)for iter.Next() { fmt.Println(iter.Node().String()) // returns only the values of the text-node}...有沒有辦法轉(zhuǎn)換iter.Node()回 html 標(biāo)記之類的<div>...</div>?iter.Node().String()僅返回所有內(nèi)部文本節(jié)點(diǎn)的值。據(jù)我所知,xmlpath-package的文檔沒有提供這樣的功能。
2 回答

largeQ
TA貢獻(xiàn)2039條經(jīng)驗(yàn) 獲得超8個(gè)贊
你是對(duì)的 -gopkg.in/xmlpath.v2
功能僅限于讀取節(jié)點(diǎn)的內(nèi)容。在 Go 中使用 DOM 的替代方案并不多。
在本機(jī) Go 庫(kù)中,我只能提到goquery。它僅適用于 HTML,不支持 XPath 但支持 CSS 選擇器。也許這對(duì)你來說就足夠了。
如果您真的需要通過 XPath 處理 HTML 和 XML,那么 Go 的 libxml 包裝器稱為gokogiri。它支持 libxml 的所有功能,因此您可以獲取節(jié)點(diǎn)、內(nèi)部/外部 HTML、屬性和其他內(nèi)容。我用它來提取當(dāng)前處于生產(chǎn)狀態(tài)的一項(xiàng)服務(wù)中的文本內(nèi)容。它比 PHP 的 DOMDocument 快一點(diǎn)。只有一個(gè)限制是我不確定它是否支持高于 1.4.* 的 Go 版本。哦,在 Windows 上安裝有點(diǎn)棘手。
- 2 回答
- 0 關(guān)注
- 274 瀏覽
添加回答
舉報(bào)
0/150
提交
取消