網(wǎng)上老是有人說自己寫的爬蟲繞開 會員登錄 去下載只有會員才能看的小說,這是如何實現(xiàn)的?謝謝!!1
2 回答

Helenr
TA貢獻(xiàn)1780條經(jīng)驗 獲得超4個贊
服務(wù)器端并不能識別你的程序是瀏覽器還是爬蟲,瀏覽器本身也是程序,只要爬蟲在傳輸數(shù)據(jù)上表現(xiàn)和瀏覽器完全一樣,理論上瀏覽器能看到的東西爬蟲都能看到。
服務(wù)器一般是靠cookie來區(qū)分登陸還是非登陸用戶,只要爬蟲攜帶認(rèn)證后的用戶的cookie,對于服務(wù)器那邊來說,會認(rèn)為你是個登陸后的會員用戶,便把登陸后的信息返回給你了。
這種方式本身還是要有個合法的會員信息的,用現(xiàn)成cookie也好,靠爬蟲模擬登陸新生成的cookie也好,沒有這個的話是無法表明你是個會員用戶的,所謂繞開會員登錄只是一個宣稱手段罷了。

拉丁的傳說
TA貢獻(xiàn)1789條經(jīng)驗 獲得超8個贊
我也??葱≌f,小說的登陸為了方便都是cookie存儲的,
估計爬蟲讀出瀏覽器中所有cookie循環(huán)登陸的
你給cookie的key,val都加密,再在一定時間內(nèi)登陸超過一定的次數(shù)就不允許登陸
- 2 回答
- 0 關(guān)注
- 402 瀏覽
添加回答
舉報
0/150
提交
取消