首頁(yè) 猿問(wèn) 如何使用 BS4...

如何使用 BS4 搜索特定單詞，然后在該單詞之后立即獲取同一元素中的文本？

Python

湖上湖 2023-06-20 17:31:06

我是 BeautifulSoup 和 Python 的新手。我正在抓取一些頁(yè)面，有時(shí)會(huì)給出電話號(hào)碼，有時(shí)卻沒(méi)有。如果它在那里，我想刮掉它。HTML 非常簡(jiǎn)單：<div> <p>Email: someone@somewhere.com</p> <p>Telephone: 1234567890</p> <p>Postal code: B3H 2F5</p></div>我正在檢查電話號(hào)碼是否存在，如下所示：phoneNumber = soup.find(string='Telephone:')if phoneNumber: phoneNumber = # Some code here to get the actual number else: phoneNumber = ('None')print (phoneNumber)該 div 中通常還有其他幾個(gè) p 標(biāo)簽，但并不總是存在相同的標(biāo)簽，因此我不能依賴它們作為參考點(diǎn)。電話號(hào)碼也不總是遵循相同的模式。我能做的最好的事情就是確定電話號(hào)碼始終以“電話：”開頭并包含在 ap 標(biāo)簽中。這似乎是找到它的唯一可靠方法。我不明白的是如何獲得實(shí)際的電話號(hào)碼，即“電話：”后的標(biāo)簽如何在“電話：”一詞后獲取此元素中的數(shù)字？

查看完整描述

2 回答

交互式愛情

TA貢獻(xiàn)1712條經(jīng)驗(yàn) 獲得超3個(gè)贊

使用一些正則表達(dá)式邏輯，您可以直接找到<p>包含電話號(hào)碼的標(biāo)簽：

import re

from bs4 import BeautifulSoup

html = """<div>

<p>Email: someone@somewhere.com</p>

<p></p>

<p>Postal code: B3H 2F5</p>

<p>Telephone: 1234567890</p>

</div>"""

soup = BeautifulSoup(html)

#Find the tag containing "Telephone:"

phone_tag = soup.find('p', text=re.compile('Telephone:'))

if phone_tag:

phone = phone_tag.text.replace('Telephone:','').strip()

else:

phone = None

反對(duì) 回復(fù) 2023-06-20

當(dāng)年話下

TA貢獻(xiàn)1890條經(jīng)驗(yàn) 獲得超9個(gè)贊

事實(shí)證明，我不知道使用搜索此字符串的更好方法re.compile。我會(huì)在這里發(fā)布答案，以防其他人正在尋找同樣的東西。

對(duì)我有用的是：

phoneNumber = soup.find('p', text = re.compile('Telephone:'))

這給了我字符串出現(xiàn)的整個(gè) p 標(biāo)簽，我一開始沒(méi)有意識(shí)到，所以我可以這樣做：

if phoneNumber:

phoneNumber = phoneNumber.get_text().strip().replace('Telephone:', '')

else:

phoneNumber = ('None')

反對(duì) 回復(fù) 2023-06-20

2 回答
0 關(guān)注
132 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

如何使用 BS4 搜索特定單詞，然后在該單詞之后立即獲取同一元素中的文本？

如何使用 BS4 搜索特定單詞，然后在該單詞之后立即獲取同一元素中的文本？

2 回答

添加回答

如何使用 BS4 搜索特定單詞，然后在該單詞之后立即獲取同一元素中的文本？

如何使用 BS4 搜索特定單詞，然后在該單詞之后立即獲取同一元素中的文本？