最贊回答 / 死瘦子
這是因為雖然 fout.write(data['title'].encode('utf-8')) 指定了編碼,但你用瀏覽器打開頁面時瀏覽器并不是使用的utf-8的編碼,可能是GBK的編碼,你可以選擇下瀏覽器編碼就正常了。你也可以修改下代碼,在 fout.write("<html>") 后面加句 fout.write('<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />'),這 <meta ...
2016-06-07
最新回答 / huangjunli
F12->Network->F5刷新->查找并點擊你需要的JS文件,例如common.js?1464072928,里面的RequestRUL:http://www.umindex.com/javascripts/build/models.js?1464072928。把這個信息直接抓下來就行了。只是分析起來比較麻煩
2016-06-02
已采納回答 / charsandrew
可以的,只是比較麻煩,組織程序也只是自動幫你完成一些項目的創(chuàng)建,這些都是可以通過idle手動完成的1,要創(chuàng)建一個baike_spider的文件夾,2在文件夾里創(chuàng)建一個名為__init__.py的文本文件,內(nèi)容可以為空(如果你自己看視頻,會看到老師在創(chuàng)建包后,編輯器自動添加了一個__init__.py的文件,這里我們要手動創(chuàng)建)3,在文件夾里寫入各個模塊4. 將該文件夾放到python安裝路徑下的lib文件夾里,運行主函數(shù),/還有一種方法是修改命名空間的搜索路徑給你個鏈接可以看看:http://edu.cs...
2016-05-30