python版本3.7.0在使用urllib爬蟲獲取網(wǎng)頁html代碼時(shí),編碼時(shí)報(bào)錯(cuò),忽略掉錯(cuò)誤。html = data.decode(charset,errors='ignore')得到的html只有上半部分。而網(wǎng)頁本應(yīng)該已</html>結(jié)尾的。就是說丟失了一部分。請問各位大神這是什么情況?網(wǎng)上都搜不到結(jié)果。難道就我一個(gè)人遇到嗎?話說python寫爬蟲確實(shí)快,但我剛開始都踩了好幾個(gè)坑了。
python3用urllib爬網(wǎng)頁,為什么得到的html只有上半部分?
浮云間
2018-07-11 17:13:36