第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機(jī)立即綁定

「docker實(shí)戰(zhàn)篇」python的docker-抖音視頻抓取-總結(jié)(下)(26)

標(biāo)簽:
Python Docker 爬蟲

从19到24节都说的抖音数据的抓取,从web端用户信息抓取,app端粉丝数据抓取,视频数据。

(一)抓取三大块

  • 1.web端用户信息抓取

技术困难:
个人数据界面-TTF混淆

解决方案:
枚举的方式分析出来数字

注意事项:
通过TTF字体数据对应,如果抖音TTF字体库发生改变,爬虫也需要做对应修改。

  • 2.app端粉丝数据获取

技术困难:
appium模拟滑动+mitmdump解析数据
通过一台设备抓取比较慢,多设备多进程抓取抖音的数据

注意事项:
1.appium模拟滑动抖音粉丝数据,一个名人一般仅能获取5000条粉丝数据。
2.移动设备设置代理进行抓包后,如遇到无法联网或无法解析https数据时,需要安装Xposed框架+JustTrustme组件进行屏蔽证书的校验。如果用真实手机建议直接刷个带Xposed框架和开通Root权限的系统,为了避免【变砖】。
3.在设置多设备,多进程数据抓取时,需要设置appium服务端的bootstrap端口,以及客户端的udid字段。

  • 3.web端视频数据抓取

技术困难:
破解js获取signature,通过浏览器获取到signature

注意事项:
视频抓取,需要破解signature字段,使用拼接html,解析js

技术参考:
https://douyin.wlansq.cn/

2个请求中,getjs里面有个tac,最早的时候一直获取不到数据,后来才知道原来是tac 没有获取。

PS:

1.数据抓取的时,需要加上代理,伪装爬虫
2.条件允许最好还是使用真实移动设备,最好使用小米,华为的安全性太高了。国产的华为手机安全要求很高,不插入手机卡,usb调试模式都打不开。破解系统还需要收费。
3.小米刷机一般使用【刷机大师】,【刷机精灵】,(【线刷宝】会安装一些流氓软件,但是线刷宝确实好用,忍着吧)


點(diǎn)擊查看更多內(nèi)容
TA 點(diǎn)贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優(yōu)質(zhì)文章

正在加載中
  • 推薦
  • 評論
  • 收藏
  • 共同學(xué)習(xí),寫下你的評論
感謝您的支持,我會繼續(xù)努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進(jìn)行掃碼打賞哦
今天注冊有機(jī)會得

100積分直接送

付費(fèi)專欄免費(fèi)學(xué)

大額優(yōu)惠券免費(fèi)領(lǐng)

立即參與 放棄機(jī)會
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號

舉報

0/150
提交
取消