課程
/后端開發(fā)
/Python
/Python開發(fā)簡單爬蟲
.html文件中亂碼是怎么回事?
2016-03-19
源自:Python開發(fā)簡單爬蟲 7-7
正在回答
顯示這樣???
1、在將root_url 作為unicode來處理
????root_url = u"http://baike.baidu.com/view/21087.htm"
2、在獲得output.html的輸出的時候,指定字符編碼
??? def output_html(self):??????? fout = open('output.html', mode='w',encoding='gb18030')
舉報
本教程帶您解開python爬蟲這門神奇技術的面紗
Copyright ? 2025 imooc.com All Rights Reserved | 京ICP備12003892號-11 京公網(wǎng)安備11010802030151號
購課補貼聯(lián)系客服咨詢優(yōu)惠詳情
慕課網(wǎng)APP您的移動學習伙伴
掃描二維碼關注慕課網(wǎng)微信公眾號
2016-08-07
2016-03-22
1、在將root_url 作為unicode來處理
????root_url = u"http://baike.baidu.com/view/21087.htm"
2、在獲得output.html的輸出的時候,指定字符編碼
??? def output_html(self):
??????? fout = open('output.html', mode='w',encoding='gb18030')