我正在嘗試從此網(wǎng)頁中提取文章的文本內(nèi)容。我只是在嘗試提取文章內(nèi)容,而不是“關(guān)于作者部分”。問題在于所有內(nèi)容都不在標(biāo)記之類<div>。因此我無法提取它們,因?yàn)樗鼈兌荚?lt;p>標(biāo)記內(nèi)。當(dāng)我提取所有<p>標(biāo)簽時(shí),我還將獲得“關(guān)于作者”部分。我必須從這個(gè)網(wǎng)站上抓取許多頁面。有沒有辦法使用美麗的湯來做到這一點(diǎn)?我目前正在嘗試:p_tags=soup.find_all('p')for row in p_tags: print(row)
添加回答
舉報(bào)
0/150
提交
取消