課程
/后端開發(fā)
/Python
/Python開發(fā)簡(jiǎn)單爬蟲
這個(gè)get_text()方法是soup的,但是那個(gè)字典是怎么回事,對(duì)象到底是什么?
2016-06-09
源自:Python開發(fā)簡(jiǎn)單爬蟲 6-3
正在回答
在獲取全部鏈接的循環(huán)后面加上代碼:
??? print type(link),type(links)
結(jié)果為:<class 'bs4.element.Tag'> <class 'bs4.element.ResultSet'>
說明soup.find_all的返回結(jié)果links是一個(gè)自定義的類,node也是一種自定義的類
for i in range(3):??? print links[i].name, links[i]['href'],links[i].get_text(),links[i]??? print type(links[i]),type(links)
由于上面代碼可行,說明links雖然不是列表,但是了類似列表,也可以看出node是links(類似列表)的元素,而且node的類里面應(yīng)該是有一個(gè)將字符串儲(chǔ)存為字典的部分,后面的node['href']才可行
ToBeCTO 提問者
舉報(bào)
本教程帶您解開python爬蟲這門神奇技術(shù)的面紗
Copyright ? 2025 imooc.com All Rights Reserved | 京ICP備12003892號(hào)-11 京公網(wǎng)安備11010802030151號(hào)
購課補(bǔ)貼聯(lián)系客服咨詢優(yōu)惠詳情
慕課網(wǎng)APP您的移動(dòng)學(xué)習(xí)伙伴
掃描二維碼關(guān)注慕課網(wǎng)微信公眾號(hào)
2016-06-09
在獲取全部鏈接的循環(huán)后面加上代碼:
??? print type(link),type(links)
結(jié)果為:<class 'bs4.element.Tag'> <class 'bs4.element.ResultSet'>
說明soup.find_all的返回結(jié)果links是一個(gè)自定義的類,node也是一種自定義的類
for i in range(3):
??? print links[i].name, links[i]['href'],links[i].get_text(),links[i]
??? print type(links[i]),type(links)
由于上面代碼可行,說明links雖然不是列表,但是了類似列表,也可以看出node是links(類似列表)的元素,而且node的類里面應(yīng)該是有一個(gè)將字符串儲(chǔ)存為字典的部分,后面的node['href']才可行