我只需要提取網(wǎng)頁中某個部分的鏈接,但我在 Beautifulsoup 上找到的所有教程總是抓取整個頁面。我如何只抓取某個內(nèi)的鏈接<div class="xyz">???編輯:我目前有這段代碼:soup1.find_all('h3', class_="entry-title td-module-title")這會找到網(wǎng)頁的所有鏈接,這些鏈接包含在class_="entry-title td-module-title"我想找到類中仍然包含的所有鏈接"entry-title td-module-title"`但僅包含在以下部分中的那些:<div class="wpb_wrapper">(對不起,如果我的問題有點缺乏信息,我試著添加更多細(xì)節(jié))
2 回答

www說
TA貢獻1775條經(jīng)驗 獲得超8個贊
嘗試這個:
soup2 = soup1.find_all('div',class_='wpb_wrapper')
results = []
for div in soup2:
required = div.find_all('h3', class_="entry-title td-module-title")
results.append(required)

翻過高山走不出你
TA貢獻1875條經(jīng)驗 獲得超3個贊
您可以使用 CSS 選擇器來完成此任務(wù):
for link in soup.select('div.wpb_wrapper h3.entry-title.td-module-title a'): print(link['href'])
<h3 class="entry-title td-module-title">
這將打印under 下的所有鏈接<div class="wpb_wrapper">
。
添加回答
舉報
0/150
提交
取消