課程
/后端開發(fā)
/Python
/python遇見數(shù)據(jù)采集
自定義方法搜索文檔樹,自定義的方法沒有起到作用
2017-01-09
源自:python遇見數(shù)據(jù)采集 3-4
正在回答
原本我也是遇到這個問題搜索全網(wǎng)發(fā)現(xiàn)就這么一個帖子相關-。-
其實程序輸出沒錯,是理解錯誤的原因。
BS4解析HTML文件,就很直接的,看到<p>這個標簽符合條件,返回值為True,打印出來的就是<p>標簽里的內(nèi)容呀,只是恰好包含了幾個<a>標簽,因為這些<a>標簽是<p>標簽的子節(jié)點呀。
而并沒有單獨地把<a>標簽打印出來就說明程序的輸出是沒問題的。
Explorer_C
沒有必要那么麻煩的啊soup.find_all("a", class_="sister")直接遍歷“愛麗絲文檔”里面的id class是sisteer的a標簽,soup.find_all(id='link2'這個遍歷文檔里id為link2的a標簽,不需要你那樣的,而且我不明白你那樣寫是為了什么。beautifulsoup中文文檔這個你可以先看一下。
舉報
本教程讓你初步掌握Python進行數(shù)據(jù)采集,創(chuàng)造屬于你的價值
1 回答beautifulsoup 的獲取
2 回答beautifulsoup 安裝失敗
2 回答beautifulsoup這節(jié)課到底在講?
1 回答beautifulsoup怎么解析出js里面的連接
1 回答beautifulsoup遇到頁面注釋里面的無法提取數(shù)據(jù)?
Copyright ? 2025 imooc.com All Rights Reserved | 京ICP備12003892號-11 京公網(wǎng)安備11010802030151號
購課補貼聯(lián)系客服咨詢優(yōu)惠詳情
慕課網(wǎng)APP您的移動學習伙伴
掃描二維碼關注慕課網(wǎng)微信公眾號
2017-12-31
原本我也是遇到這個問題搜索全網(wǎng)發(fā)現(xiàn)就這么一個帖子相關-。-
其實程序輸出沒錯,是理解錯誤的原因。
BS4解析HTML文件,就很直接的,看到<p>這個標簽符合條件,返回值為True,打印出來的就是<p>標簽里的內(nèi)容呀,只是恰好包含了幾個<a>標簽,因為這些<a>標簽是<p>標簽的子節(jié)點呀。
而并沒有單獨地把<a>標簽打印出來就說明程序的輸出是沒問題的。
2017-01-10
沒有必要那么麻煩的啊soup.find_all("a", class_="sister")直接遍歷“愛麗絲文檔”里面的id class是sisteer的a標簽,soup.find_all(id='link2'這個遍歷文檔里id為link2的a標簽,不需要你那樣的,而且我不明白你那樣寫是為了什么。beautifulsoup中文文檔這個你可以先看一下。