首頁(yè) 猿問(wèn) 使用 XPath 在內(nèi)部屬性中接收數(shù)據(jù)

使用 XPath 在內(nèi)部屬性中接收數(shù)據(jù)

Python

慕慕森 2021-11-16 15:35:47

我想在里面獲取文本div和內(nèi)部屬性，例如ul和li我的 html 層次結(jié)構(gòu)如下所示<div> text <ul> <li>text</li> <li>text</li> <li>text</li> </ul></div>所以我可以使用xpath('div/text()')函數(shù)獲取 div 文本，但我被困在內(nèi)部屬性中獲取其他文本。有人可以幫助我如何正確地做到這一點(diǎn)。

查看完整描述

1 回答

隔江千里

TA貢獻(xiàn)1906條經(jīng)驗(yàn) 獲得超10個(gè)贊

使用BeautifulSoup：

from bs4 import BeautifulSoup

import urllib

test = '''<div>text_0<ul>

</ul>

</div>'''

soup = BeautifulSoup(test, 'html.parser')

data = soup.find_all("div")

for d in data:

print(d.text)

輸出：

text_0

text_1

text_2

text_3

使用xpath：

import lxml.html as LH

content = '''<div>text_0<ul>

</ul>

</div>'''

root = LH.fromstring(content)

for elem in root.xpath('//div/descendant::text()'):

print(elem)

反對(duì) 回復(fù) 2021-11-16

1 回答
0 關(guān)注
189 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

使用 XPath 在內(nèi)部屬性中接收數(shù)據(jù)

使用 XPath 在內(nèi)部屬性中接收數(shù)據(jù)

1 回答

添加回答