已采納回答 / NinjaPanda
<...code...>因?yàn)闆](méi)有找到標(biāo)題或者簡(jiǎn)介,所以不能獲取內(nèi)容
已采納回答 / 墨爾卡娜
當(dāng)?shù)谝粋€(gè)頁(yè)面被分析之后,會(huì)獲取到該頁(yè)面上的其他詞條的跳轉(zhuǎn)url,也就是/view/*****.html,然后這些url會(huì)被拼裝成完整的url加入到set中,程序循環(huán)一次之后檢查set是否為空,如果不為空就會(huì)拿一個(gè)新的url去爬取,新的頁(yè)面也會(huì)有些引用的詞條的,然后就源源不斷的有新的詞條地址添加到set中去了,代碼就是分析模塊中使用正則表達(dá)式的那部分
已采納回答 / Duiknow
代碼沒(méi)有報(bào)錯(cuò)是因?yàn)槟阌凶远x報(bào)錯(cuò)的try ?except ? ?應(yīng)該是哪里你出現(xiàn)了拼寫(xiě)錯(cuò)誤或者判斷條件寫(xiě)錯(cuò)了 ? 運(yùn)行跟蹤調(diào)試下就可以了 ? 代碼剛剛測(cè)試過(guò)沒(méi)有問(wèn)題
講師回答 / 螞蟻帥帥
看起來(lái)確實(shí)是,你的__init___中,后面多了個(gè)下劃線
已采納回答 / 黑歷史不刪除后果很?chē)?yán)重
建議你一步一步,逐個(gè)函數(shù)調(diào)試,光看源代碼比較難找出錯(cuò)誤所在,可以在每個(gè)方法打印是否成功運(yùn)行,找到出錯(cuò)的方法后再找出錯(cuò)的變量。這樣一定可以調(diào)試出來(lái)的,加油!
2016-09-27
最贊回答 / 慕標(biāo)6571706
已經(jīng)解決win7 python3.6 遇到亂碼的情況同明磊只需要在fout = open('output.html', 'w', encoding = 'utf-8')?fout.write("<td>%s</td>" % data['title'])?fout.write("<td>%s</td>" % data['summary'])這里面不能加.encode('utf-8'),加了會(huì)亂碼fout.write("<head><meta ...
2016-09-26
已采納回答 / Dreaman
已經(jīng)解決啦 ?我在html_downloader下的read()后加了response.read().decode('utf8',errors='replace')把html_outputer里面的encode()去掉就好了
2016-09-21
已采納回答 / sin丶
下載代碼后發(fā)現(xiàn)問(wèn)題還是挺多的,除了那個(gè)outputer,在html_parser下data寫(xiě)成date,title也打錯(cuò)了,參數(shù)page_url也沒(méi)設(shè)置。html_outputer里,方法output_html沒(méi)有寫(xiě)進(jìn)去標(biāo)題。慢慢改吧。
2016-09-13