第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問(wèn)題,去搜搜看,總會(huì)有你想問(wèn)的

使用 gocolly 抓取時(shí)如何在 html 表格單元格中保留換行符

使用 gocolly 抓取時(shí)如何在 html 表格單元格中保留換行符

Go
HUH函數(shù) 2023-03-29 17:22:13
當(dāng)我提取單元格的內(nèi)容時(shí),我試圖保留<td>表格單元格中的格式。如果 中有兩行文本(例如地址),代碼可能如下所示: <td>address line1 <br>1 address line2</td>當(dāng) colly 提取這個(gè)時(shí),我得到以下信息:address line1address line2沒(méi)有空格或換行符,因?yàn)樗?html 都已從文本中刪除。我該如何解決/解決這個(gè)問(wèn)題,以便我從<td>
查看完整描述

2 回答

?
一只斗牛犬

TA貢獻(xiàn)1784條經(jīng)驗(yàn) 獲得超2個(gè)贊

gocollygoquery在引擎蓋下使用。您可以調(diào)用所有Selection方法,包括Html()。

func (*Selection) HTML

func (s *Selection) Html() (ret string, e error)

Html 獲取匹配元素集中第一個(gè)元素的 HTML 內(nèi)容。它包括文本和注釋節(jié)點(diǎn)。

這是獲取 html 內(nèi)容的方法:

c.OnHTML("tr", func(e *colly.HTMLElement) {

? ? // You can find the elem

? ? h, _ := e.DOM.Find("td").Html()

? ? fmt.Printf("=> %s \n", h)



? ? // ...or you can loop thru all of them

? ? elem.DOM.Each(func(_ int, s *goquery.Selection) {

? ? ? ? h, _ := s.Html()

? ? ? ? fmt.Printf("=> %s \n", h)

? ? })

}


查看完整回答
反對(duì) 回復(fù) 2023-03-29
?
哈士奇WWW

TA貢獻(xiàn)1799條經(jīng)驗(yàn) 獲得超6個(gè)贊

據(jù)我所知,gocolly 不支持這種格式,但您基本上可以通過(guò)使用htmlquery(gocolly 在內(nèi)部使用它)包的OutputHTML方法來(lái)執(zhí)行如下操作

const htmlPage = `

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN"

?"http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">

<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en">

? <head>

? ? <title>Your page title here</title>

? </head>

? <body>

? ? <p>

? ? AddressLine 1?

? ? <br>

? ? AddresLine 2

? ? </p>

? </body>

</html>

`


doc, _ := htmlquery.Parse(strings.NewReader(htmlPage))

xmlNode := htmlquery.FindOne(doc, "http://p")

result := htmlquery.OutputHTML(xmlNode, false)

結(jié)果變量的輸出現(xiàn)在如下所示:


?AddressLine 1

? ?<br/>

?AddresLine 2

您現(xiàn)在可以通過(guò)標(biāo)記解析結(jié)果<br/>并獲得您想要的結(jié)果。


但我也是新手,所以也許有更好的方法來(lái)做到這一點(diǎn)。


查看完整回答
反對(duì) 回復(fù) 2023-03-29
  • 2 回答
  • 0 關(guān)注
  • 175 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)