課程
/后端開發(fā)
/Python
/Python開發(fā)簡單爬蟲
我的輸出全部都是類似這樣的b'\xe6\x96\x87\xe6\x9c\xac\xe7\xbc\x96\xe8\xbe\x91\xe5\x
怎樣才能輸出下常的東西呢?
2016-09-02
源自:Python開發(fā)簡單爬蟲 7-7
正在回答
mac上使用這些都不行
試過這種方法,還是不行
encode('utf-8').decode('utf-8')
def output_html(self): ? ?fout=open('output.html','w',encoding='utf-8') ? ?fout.write('<html>') ? ?fout.write('<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />') ? ?fout.write('<body>') ? ?fout.write('<table>') ? ?for data in self.datas: ? ? ? ?fout.write('<tr>') ? ? ? ?fout.write('<td>%s</td>' % data['url']) ? ? ? ?fout.write('<td>%s</td>' % data['title'].encode('utf-8').decode('utf-8')) ? ? ? ?fout.write('<td>%s</td>' % data['summary'].encode('utf-8').decode('utf-8')) ? ? ? ?fout.write('</tr>') ? ?fout.write('</table>') ? ?fout.write('</body>') ? ?fout.write('</html>')
風(fēng)143
自己已經(jīng)解決,也是參考了別的問題上的答案,
方法一:
fout.write("<html><meta charset=\"utf-8\" />")
下面這些不需要再寫encode('utf-8')
fout.write('<td>%s</td>'%data['url'])
? ?fout.write('<td>%s</td>'%data['title'])
? fout.write('<td>%s</td>'%data['summary'])
方法二:
fout.write("<html>")
下面這些需要再寫encode('utf-8')和decode
fout.write('<td>%s</td>'%data['url'].encode('utf-8').decode('utf-8'))
? ?fout.write('<td>%s</td>'%data['title'].encode('utf-8').decode('utf-8'))
? fout.write('<td>%s</td>'%data['summary'].encode('utf-8').decode('utf-8'))
原因不懂,但解決了問題
舉報
本教程帶您解開python爬蟲這門神奇技術(shù)的面紗
Copyright ? 2025 imooc.com All Rights Reserved | 京ICP備12003892號-11 京公網(wǎng)安備11010802030151號
購課補貼聯(lián)系客服咨詢優(yōu)惠詳情
慕課網(wǎng)APP您的移動學(xué)習(xí)伙伴
掃描二維碼關(guān)注慕課網(wǎng)微信公眾號
2016-11-26
mac上使用這些都不行
2016-10-11
試過這種方法,還是不行
2016-09-13
encode('utf-8').decode('utf-8')
2016-09-03
def output_html(self):
? ?fout=open('output.html','w',encoding='utf-8')
? ?fout.write('<html>')
? ?fout.write('<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />')
? ?fout.write('<body>')
? ?fout.write('<table>')
? ?for data in self.datas:
? ? ? ?fout.write('<tr>')
? ? ? ?fout.write('<td>%s</td>' % data['url'])
? ? ? ?fout.write('<td>%s</td>' % data['title'].encode('utf-8').decode('utf-8'))
? ? ? ?fout.write('<td>%s</td>' % data['summary'].encode('utf-8').decode('utf-8'))
? ? ? ?fout.write('</tr>')
? ?fout.write('</table>')
? ?fout.write('</body>')
? ?fout.write('</html>')
2016-09-02
自己已經(jīng)解決,也是參考了別的問題上的答案,
方法一:
fout.write("<html><meta charset=\"utf-8\" />")
下面這些不需要再寫encode('utf-8')
fout.write('<td>%s</td>'%data['url'])
? ?fout.write('<td>%s</td>'%data['title'])
? fout.write('<td>%s</td>'%data['summary'])
方法二:
fout.write("<html>")
下面這些需要再寫encode('utf-8')和decode
fout.write('<td>%s</td>'%data['url'].encode('utf-8').decode('utf-8'))
? ?fout.write('<td>%s</td>'%data['title'].encode('utf-8').decode('utf-8'))
? fout.write('<td>%s</td>'%data['summary'].encode('utf-8').decode('utf-8'))
原因不懂,但解決了問題