課程
                    
                        /后端開發(fā)
                        
                            /Python
                        
                        /python遇見數(shù)據(jù)采集

BeautifulSoup文檔實例結(jié)果不符（has_class_but_no_id())

自定義方法搜索文檔樹，自定義的方法沒有起到作用

00:01

慕粉1257044316

2017-01-09

源自：python遇見數(shù)據(jù)采集 3-4

關注問題我要回答

1447

操作

收起

2 回答

Explorer_C
2017-12-31

原本我也是遇到這個問題搜索全網(wǎng)發(fā)現(xiàn)就這么一個帖子相關-。-

其實程序輸出沒錯，是理解錯誤的原因。

BS4解析HTML文件，就很直接的，看到<p>這個標簽符合條件，返回值為True，打印出來的就是<p>標簽里的內(nèi)容呀，只是恰好包含了幾個<a>標簽，因為這些<a>標簽是<p>標簽的子節(jié)點呀。

而并沒有單獨地把<a>標簽打印出來就說明程序的輸出是沒問題的。

0 回復有任何疑惑可以回復我~

收起回答

#1

Explorer_C

說清楚點就是<a>標簽沒被作為List中的一個元素輸出。

2017-12-31 回復有任何疑惑可以回復我~

Seraphine
2017-01-10

沒有必要那么麻煩的啊soup.find_all("a", class_="sister")直接遍歷“愛麗絲文檔”里面的id class是sisteer的a標簽，soup.find_all(id='link2'這個遍歷文檔里id為link2的a標簽，不需要你那樣的，而且我不明白你那樣寫是為了什么。beautifulsoup中文文檔這個你可以先看一下。

0 回復有任何疑惑可以回復我~

收起回答

#1

Explorer_C

你根本沒懂別人問的什么。

2017-12-31 回復有任何疑惑可以回復我~