我現(xiàn)在正在自己學(xué)習(xí) Go,并且一直在獲取和解析 HTML/XML。在 Python 中,我在做網(wǎng)頁(yè)抓取時(shí)通常會(huì)編寫(xiě)以下代碼:from urllib.request import urlopen, Requesturl = "http://stackoverflow.com/"req = Request(url)html = urlopen(req).read(),然后我可以以string或的形式獲取原始 HTML/XMLbytes并繼續(xù)使用它。在 Go 中,我該如何應(yīng)對(duì)?我希望得到的是原始 HTML 數(shù)據(jù),它存儲(chǔ)在string或[]byte(雖然它可以很容易地轉(zhuǎn)換,但我根本不介意得到哪個(gè))。我考慮使用gokogiri包在 Go 中進(jìn)行網(wǎng)絡(luò)抓?。ú淮_定我是否真的會(huì)使用它?。?,但看起來(lái)它在使用它之前需要原始 HTML 文本......那么我怎樣才能獲得這樣的對(duì)象呢?或者有沒(méi)有更好的方法在 Go 中進(jìn)行網(wǎng)絡(luò)抓取工作?謝謝。
相當(dāng)于 Python 在 Go 中的 HTML 解析函數(shù)/模塊?
三國(guó)紛爭(zhēng)
2021-06-16 17:17:17