第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

Scrapy抓取新聞

Scrapy抓取新聞

德瑪西亞99 2018-07-16 12:13:26
最近使用scrapy抓取新浪智能家居新聞(http://tech.sina.com.cn/smart/),該新聞是動(dòng)態(tài)生成的,請問使用什么辦法可以抓取到。
查看完整描述

3 回答

?
蠱毒傳說

TA貢獻(xiàn)1895條經(jīng)驗(yàn) 獲得超3個(gè)贊

爬蟲對于ajax的內(nèi)容處理確實(shí)是個(gè)問題啊, 可以自己用pywebkit引擎做一個(gè),調(diào)用里面的js引擎處理那些動(dòng)態(tài)生成的內(nèi)容,但是難度有點(diǎn)高, 另一個(gè)方法是找到ajax請求的接口,然后自己構(gòu)造請求讀取數(shù)據(jù) 然后處理返回的數(shù)據(jù) 一般都是json格式。個(gè)人覺得第二種方法更簡便一點(diǎn)

查看完整回答
反對 回復(fù) 2018-07-17
?
12345678_0001

TA貢獻(xiàn)1802條經(jīng)驗(yàn) 獲得超5個(gè)贊

做通用采集工具,還是用瀏覽器內(nèi)核等待頁面加載完成再采集吧 phantomjs不錯(cuò)的
當(dāng)然這樣性能肯定沒定制開發(fā)好

查看完整回答
反對 回復(fù) 2018-07-17
?
牧羊人nacy

TA貢獻(xiàn)1862條經(jīng)驗(yàn) 獲得超7個(gè)贊

請問python社區(qū)在哪里?

哥新手學(xué)scrapy,例子入門估計(jì)已經(jīng)卡一大半人

第一個(gè)例子問題我算是搞定了,但是第二個(gè)問題馬上來了

我想爬了這個(gè)網(wǎng)頁,再根據(jù)這個(gè)網(wǎng)頁的鏈接爬另外一個(gè)網(wǎng)頁,怎么做?

哪里有人回答這些問題,或者方向(python語法和執(zhí)行框架不懂也


查看完整回答
反對 回復(fù) 2018-07-17
  • 3 回答
  • 0 關(guān)注
  • 506 瀏覽

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號