已采納回答 / 合理膳食與長壽
你的save_excel是方法,先在你調(diào)用的類里面, 把HtmlOutputer這個(gè)對象生成了self.outputer = html_outputer.HtmlOutputer()然后 outputer.save_excel()?注意excel加括號
2017-02-08
已采納回答 / chaowanghn
安裝beautifulsoup4$?easy_install?beautifulsoup4$?pip?install?beautifulsoup4然后from bs4 import BeautifulSoup
2017-01-26
已采納回答 / 慕用0833797
出于代碼嚴(yán)謹(jǐn)?shù)目紤],如果url管理器里的url來源不止一處呢,或者有多人協(xié)作時(shí),你無法保證他人加入的數(shù)據(jù)是什么樣子的
2017-01-21
已采納回答 / 慕哥0672315
.py為后綴名的文件都會被認(rèn)為是python模塊。package相當(dāng)于文件夾,只不過其每層目錄下一定有一個(gè) _init_.py 的文件。Pycharm中,在package上右鍵"New-Python File"可以新建模塊
2016-12-24
已采納回答 / 火上的冰
互聯(lián)網(wǎng)是有很多的網(wǎng)頁組成的,每個(gè)網(wǎng)頁我們通過url來訪問。使用程序?qū)rl進(jìn)行下載、解析并在其中找到我們需要的數(shù)據(jù),比如價(jià)格,圖片,相關(guān)的url等,并把這些數(shù)據(jù)保存起來形成數(shù)據(jù)集。下載,解析,再下載,再解析的過程就是爬蟲的過程。我們把這種通過url找尋數(shù)據(jù)的方法叫做爬蟲。
2016-12-19