第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

python爬蟲程序的原理是什么?PHP不能寫爬蟲嗎?

python爬蟲程序的原理是什么?PHP不能寫爬蟲嗎?

紅糖糍粑 2018-10-02 17:22:09
python爬蟲程序的原理是什么?PHP不能寫爬蟲嗎?
查看完整描述

2 回答

?
慕容708150

TA貢獻(xiàn)1831條經(jīng)驗(yàn) 獲得超4個(gè)贊

爬蟲的原理是從一個(gè)起始種子鏈接開始,發(fā)http請(qǐng)求這個(gè)鏈接,得到該鏈接中的內(nèi)容,然后大多使用正則匹配出頁(yè)面里面的有效鏈接,然后將這些鏈接保存到待訪問隊(duì)列中,等待爬取線程取這個(gè)待訪隊(duì)列,一旦鏈接訪問過了,為了有效的減少不必要的網(wǎng)絡(luò)請(qǐng)求,我們應(yīng)該把訪問過的鏈接放到一個(gè)已訪問map中,已防止重復(fù)抓取及死循環(huán)。我以上提到的過程可能是一個(gè)比較簡(jiǎn)單的爬蟲實(shí)現(xiàn),復(fù)雜的可能不會(huì)這么簡(jiǎn)單,但這里面有幾個(gè)概念,一個(gè)是發(fā)http請(qǐng)求,一個(gè)是正則匹配你感興趣的鏈接,一個(gè)是多線程,另外還有兩個(gè)隊(duì)列,理論上,任何能實(shí)現(xiàn)這么些概念的編程語(yǔ)言去寫爬蟲都是可以的,期間取舍還是看自己對(duì)熟練成都。

查看完整回答
反對(duì) 回復(fù) 2018-10-14
  • 2 回答
  • 0 關(guān)注
  • 1336 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)