最新回答 / JMcico
你的描述太少還不好定位,目前可以知道的是在spider的craw方法中,你的
print('craw?%d,?%s'?%?(count,?new_url))語(yǔ)句是執(zhí)行正常的,但是還需要debug一下,查看你的parser中獲得的data是否正常;若...
2019-09-10
最新回答 / weixin_慕沐3302781
看上面回復(fù)有python3.0的鏈接https://github.com/niuyinlong/Python ,19年12月5日可以一點(diǎn)不改直接跑
2019-09-02
已采納回答 / alone_shadow
我試了一下,我的也是報(bào)錯(cuò)的,應(yīng)該是導(dǎo)入是 import bs4,而不是import beautifulsoup4
2019-08-25
最新回答 / 谷楊
1、線程如果使用Thread,在子線程中再用進(jìn)程池Pool?就會(huì)報(bào)錯(cuò),原理不太清楚,可能需要老師來(lái)回答了,換用Process?就沒(méi)問(wèn)題了;2、這個(gè)音樂(lè)的頁(yè)面應(yīng)該是從page=1開始的,所以我稍微改了一下入?yún)ⅰD憧梢钥匆幌隆?/div>
- 課程須知
- 本課程是Python語(yǔ)言開發(fā)的高級(jí)課程 1、Python編程語(yǔ)法; 2、HTML語(yǔ)言基礎(chǔ)知識(shí); 3、正則表達(dá)式基礎(chǔ)知識(shí);
- 老師告訴你能學(xué)到什么?
- 1、爬蟲技術(shù)的含義和存在價(jià)值 2、爬蟲技術(shù)架構(gòu) 3、組成爬蟲的關(guān)鍵模塊:URL管理器、HTML下載器和HTML解析器 4、實(shí)戰(zhàn)抓取百度百科1000個(gè)詞條頁(yè)面數(shù)據(jù)的抓取策略設(shè)定、實(shí)戰(zhàn)代碼編寫、爬蟲實(shí)例運(yùn)行 5、一套極簡(jiǎn)的可擴(kuò)展爬蟲代碼,修改本代碼,你就能抓取任何互聯(lián)網(wǎng)網(wǎng)頁(yè)!
微信掃碼,參與3人拼團(tuán)