應(yīng)對(duì)網(wǎng)站反爬機(jī)制的處理

標(biāo)簽：

Python 大數(shù)據(jù) 人工智能

在大数据如此火的今天，爬虫是其中不可或缺的一部分。作为一位爬虫我们都是知道想要获取数据也不是很容易的事，因为不管大大小小的网站都是做了很多反爬机制来阻碍我们的脚步，但是方法总比困难多。我们今天先来分析下网站都是用过哪些方式来阻止我们的。

1、验证码

2、ua

3、登陆验证

4、封账号

5、加密

6、ip限制

今天我们就重点来讲下网站的ip限制机制，很多网站会根据IP地址访问频率进行反爬，短时间内禁止IP访问，这时我们想采集数据要么使用代理IP，要么伪装ip。那么对于ip我们要怎么解决了？

自己自建ip池，每次访问网站的时候去选择代理，不过需要经常更新代理池。
购买优质代理或动态转发（爬虫代理），这是最省时省力的方法。
网站抓取免费的ip来使用，虽然可行，但是效果不会很理想。
间隔一定的时间在进行数据采集，但是这会大大的增加我们工作的时长。

以下我们分享下用代理来解决网站封ip的示例，对于“频繁点击”的情况，我们还可以通过限制爬虫访问网站的频率来避免被网站禁掉。

        #! -*- encoding:utf-8 -*-        import requests        import random        # 要访问的目标页面        targetUrl = "http://www.csdn.net"        # 要访问的目标HTTPS页面        # targetUrl = "https://www.csdn.net"        # 代理服务器(产品官网 www.16yun.cn)        proxyHost = "t.16yun.cn"        proxyPort = "31111"        # 代理隧道验证信息        proxyUser = "16JVFLKJ"        proxyPass = "254565"        proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {            "host" : proxyHost,            "port" : proxyPort,            "user" : proxyUser,            "pass" : proxyPass,        }        # 设置 http和https访问都是用HTTP代理        proxies = {            "http"  : proxyMeta,            "https" : proxyMeta,        }        #  设置IP切换头        tunnel = random.randint(1,10000)        headers = {"Proxy-Tunnel": str(tunnel)}        resp = requests.get(targetUrl, proxies=proxies, headers=headers)        print resp.status_code        print resp.text

點(diǎn)擊查看更多內(nèi)容

為 TA 點(diǎn)贊

若覺(jué)得本文不錯(cuò)，就分享一下吧！

評(píng)論

評(píng)論

共同學(xué)習(xí)，寫(xiě)下你的評(píng)論

評(píng)論加載中...

展開(kāi)查看更多評(píng)論

作者其他優(yōu)質(zhì)文章

正在加載中

專(zhuān)業(yè)爬蟲(chóng)

Python工程師

手記
篇

粉絲

9

獲贊與收藏

17

關(guān)注作者，訂閱最新文章

閱讀免費(fèi)教程

Python 辦公自動(dòng)化教程

17個(gè)小節(jié) 26988 912

Python 算法入門(mén)教程

15個(gè)小節(jié) 29441 1131

Python 進(jìn)階應(yīng)用教程

38個(gè)小節(jié) 71026 1107

推薦

評(píng)論

收藏

共同學(xué)習(xí)，寫(xiě)下你的評(píng)論



感謝您的支持，我會(huì)繼續(xù)努力的～

掃碼打賞，你說(shuō)多少就多少

贊賞金額會(huì)直接到老師賬戶(hù)

支付方式

打開(kāi)微信掃一掃，即可進(jìn)行掃碼打賞哦

今天注冊(cè)有機(jī)會(huì)得

100積分直接送

付費(fèi)專(zhuān)欄免費(fèi)學(xué)

大額優(yōu)惠券免費(fèi)領(lǐng)

立即參與放棄機(jī)會(huì)

點(diǎn)擊
抽獎(jiǎng)

慕課手記新用戶(hù)專(zhuān)享福利

恭喜你，你的運(yùn)氣太好了，居然抽中了 100個(gè)積分！

恭喜你，抽中了價(jià)值元的專(zhuān)欄！

太棒了，直接落到你賬戶(hù)里！

積分商城里的羅技鼠標(biāo)、機(jī)械鍵盤(pán)、
Kindle 閱讀器、小米平衡車(chē)
Apple iPad （10.2英寸）、大額優(yōu)惠券
在等著你去兌換了噢

作者：

免費(fèi)贈(zèng)送

兌換碼：1111222211 復(fù)制

優(yōu)惠券可用于購(gòu)買(mǎi)實(shí)戰(zhàn)課、體系課
無(wú)門(mén)檻使用

先去看看，有什么好東西馬上兌換


第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

應(yīng)對(duì)網(wǎng)站反爬機(jī)制的處理

閱讀免費(fèi)教程