第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

在新浪微博現(xiàn)行的架構(gòu)里,我如何爬取單個用戶的所有微博?

在新浪微博現(xiàn)行的架構(gòu)里,我如何爬取單個用戶的所有微博?

幕布斯6054654 2019-03-12 17:15:02
近期在新浪微博上關(guān)注了一個相當(dāng)有料的博主,個人大概有兩萬多條微博的數(shù)據(jù),基本上是以純文字居多。有沒有做過數(shù)據(jù)采集的和爬蟲的小伙伴,說說這部分思路和理解?(個人也在摸索)
查看完整描述

5 回答

?
紅顏莎娜

TA貢獻(xiàn)1842條經(jīng)驗 獲得超13個贊

我之前做過一個爬微博文章的,用的是puppeteer.js,完全模擬的是用戶行為,不會被屏蔽檢測
你可以看下這個庫

查看完整回答
反對 回復(fù) 2019-04-04
?
富國滬深

TA貢獻(xiàn)1790條經(jīng)驗 獲得超9個贊

爬微博是犯法的喲,請仔細(xì)閱讀微博的用戶協(xié)議。所以偷偷搞就是了,不要這么大張旗鼓的……


查看完整回答
反對 回復(fù) 2019-04-04
?
至尊寶的傳說

TA貢獻(xiàn)1789條經(jīng)驗 獲得超10個贊

Java
沒做過微博的,但思路的話大概就是先獲取認(rèn)證Cookie,Token之類的,然后用Fiddler抓包,主要是抓請求數(shù)據(jù)的接口,然后在用Jsoup把微博的部分抓下來進(jìn)行持久化。
關(guān)于源的話應(yīng)該有App接口,或者是PC網(wǎng)頁和H5網(wǎng)頁,看哪個更加容易選哪個。

查看完整回答
反對 回復(fù) 2019-04-04
?
紅糖糍粑

TA貢獻(xiàn)1815條經(jīng)驗 獲得超6個贊

微博有自己的開放平臺,你可以通過微博的API獲取,沒必要用爬蟲


查看完整回答
反對 回復(fù) 2019-04-04
  • 5 回答
  • 0 關(guān)注
  • 626 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號