第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定

爬蟲遇見亂碼和抓取數(shù)量不定

大概遇到了兩個問題:1、每次運行能夠抓取的記錄數(shù)量不定,有時候幾十條,有時候可以抓到幾百條,但是沒有一次抓滿了1000條的,系統(tǒng)運行也不報錯,也會生成相應(yīng)的html文件,請問這種情況是什么回事啊,有沒有高手解答下;2、生成的html的中文是亂碼,我特意在控制臺把抓取的title和summary都打印了出來,是正常的,但是生成的html就是亂碼,求指教啊

正在回答

1 回答

1.是因為網(wǎng)絡(luò)?

2.還是編碼問題python3的話可以試試這個在html_outputer里修改如下:

#coding utf-8


class HtmlOutputer(object):


? ? def __init__(self):

? ? ? ? self.datas = []

? ? ? ??



? ? def collect_data(self, data):

? ? ? ? if data is None:

? ? ? ? ? ? return

? ? ? ? self.datas.append(data)


? ? def output_html(self):

? ? ? ? fout = open('output.html', 'w', encoding='utf-8')

? ? ? ? fout.write("<html><meta charset=\"utf-8\" />")

? ? ? ? fout.write("<body>")

? ? ? ? fout.write("<table>")


? ? ? ? for data in self.datas:

? ? ? ? ? ? fout.write("<tr>")

? ? ? ? ? ? fout.write("<td>%s</td>" % data['url'])

? ? ? ? ? ? fout.write("<td>%s</td>" % data['title'])

? ? ? ? ? ? fout.write("<td>%s</td>" % data['summary'])

? ? ? ? ? ? fout.write("</tr>")

? ? ? ? fout.write("</table>")

? ? ? ? fout.write("</body>")

? ? ? ? fout.write("</html>")

? ? ? ? fout.close()

? ??

0 回復(fù) 有任何疑惑可以回復(fù)我~

舉報

0/150
提交
取消
Python開發(fā)簡單爬蟲
  • 參與學(xué)習(xí)       227603    人
  • 解答問題       1288    個

本教程帶您解開python爬蟲這門神奇技術(shù)的面紗

進入課程

爬蟲遇見亂碼和抓取數(shù)量不定

我要回答 關(guān)注問題
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號