第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機(jī)立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

使用 XPath 在內(nèi)部屬性中接收數(shù)據(jù)

使用 XPath 在內(nèi)部屬性中接收數(shù)據(jù)

慕慕森 2021-11-16 15:35:47
我想在里面獲取文本div和內(nèi)部屬性,例如ul和li我的 html 層次結(jié)構(gòu)如下所示<div>  text  <ul>     <li>text</li>     <li>text</li>     <li>text</li>  </ul></div>所以我可以使用xpath('div/text()')函數(shù)獲取 div 文本,但我被困在內(nèi)部屬性中獲取其他文本。有人可以幫助我如何正確地做到這一點(diǎn)。
查看完整描述

1 回答

?
隔江千里

TA貢獻(xiàn)1906條經(jīng)驗(yàn) 獲得超10個贊

使用BeautifulSoup:


from bs4 import BeautifulSoup

import urllib


test = '''<div>text_0<ul>

     <li>text_1</li>

     <li>text_2</li>

     <li>text_3</li>

  </ul>

</div>'''


soup = BeautifulSoup(test, 'html.parser')

data = soup.find_all("div")

for d in data:

    print(d.text)

輸出:


text_0

text_1

text_2

text_3

使用xpath:


import lxml.html as LH


content = '''<div>text_0<ul>

     <li>text_1</li>

     <li>text_2</li>

     <li>text_3</li>

  </ul>

</div>'''

root = LH.fromstring(content)

for elem in root.xpath('//div/descendant::text()'):

    print(elem)


查看完整回答
反對 回復(fù) 2021-11-16
  • 1 回答
  • 0 關(guān)注
  • 182 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號