首頁(yè) 猿問在 Go 中將 xpath...

在 Go 中將 xpath 節(jié)點(diǎn)轉(zhuǎn)換回 html 標(biāo)記

Go

素胚勾勒不出你 2022-01-04 10:15:03

import ( "fmt" "gopkg.in/xmlpath.v2" "log")...path := xmlpath.MustCompile("//div[@id='23']")tree, err := xmlpath.ParseHTML(reader)if err != nil { log.Fatal("HTML parsing error, maybe not wellformed", err)}iter := path.Iter(tree)for iter.Next() { fmt.Println(iter.Node().String()) // returns only the values of the text-node}...有沒有辦法轉(zhuǎn)換iter.Node()回 html 標(biāo)記之類的<div>...</div>？iter.Node().String()僅返回所有內(nèi)部文本節(jié)點(diǎn)的值。據(jù)我所知，xmlpath-package的文檔沒有提供這樣的功能。

查看完整描述

2 回答

largeQ

TA貢獻(xiàn)2039條經(jīng)驗(yàn) 獲得超8個(gè)贊

你是對(duì)的 -gopkg.in/xmlpath.v2功能僅限于讀取節(jié)點(diǎn)的內(nèi)容。在 Go 中使用 DOM 的替代方案并不多。

在本機(jī) Go 庫(kù)中，我只能提到goquery。它僅適用于 HTML，不支持 XPath 但支持 CSS 選擇器。也許這對(duì)你來說就足夠了。

如果您真的需要通過 XPath 處理 HTML 和 XML，那么 Go 的 libxml 包裝器稱為gokogiri。它支持 libxml 的所有功能，因此您可以獲取節(jié)點(diǎn)、內(nèi)部/外部 HTML、屬性和其他內(nèi)容。我用它來提取當(dāng)前處于生產(chǎn)狀態(tài)的一項(xiàng)服務(wù)中的文本內(nèi)容。它比 PHP 的 DOMDocument 快一點(diǎn)。只有一個(gè)限制是我不確定它是否支持高于 1.4.* 的 Go 版本。哦，在 Windows 上安裝有點(diǎn)棘手。

反對(duì) 回復(fù) 2022-01-04