第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

使用Python解析HTML

使用Python解析HTML

使用Python解析HTML我正在尋找一個(gè)用于Python的HTMLParser模塊,它可以幫助我以Python列表/字典/對(duì)象的形式獲得標(biāo)記。如果我有一份表格的文件:<html><head>Heading</head><body attr1='val1'>     <div class='container'>         <div id='class'>Something here</div>         <div>Something else</div>     </div></body></html>然后,它應(yīng)該給我一種通過HTML標(biāo)記的名稱或id訪問嵌套標(biāo)記的方法,這樣我基本上可以讓它在div帶標(biāo)簽class='container'包含在body標(biāo)簽或者類似的東西。如果您使用了Firefox的“檢查元素”功能(查看HTML),您就會(huì)知道它以一種很好的嵌套方式給出了所有的標(biāo)記,就像樹一樣。我想要一個(gè)內(nèi)置模塊,但這可能要求太多了。我在Stack溢出網(wǎng)站上遇到了很多問題,互聯(lián)網(wǎng)上也有幾個(gè)博客,其中大多數(shù)都建議BeautifulSoup、lxml或HTMLParser,但這些問題中很少有詳細(xì)說明功能的,只是討論了哪一個(gè)更快/更有效。
查看完整描述

3 回答

?
BIG陽

TA貢獻(xiàn)1859條經(jīng)驗(yàn) 獲得超6個(gè)贊

這樣,我基本上可以要求它給我div標(biāo)記中的內(nèi)容/文本,包含在body標(biāo)記中的class=‘容器’,或者類似的東西。

try: 
    from BeautifulSoup import BeautifulSoupexcept ImportError:
    from bs4 import BeautifulSouphtml = #the HTML code you've written aboveparsed_html = BeautifulSoup(html)print parsed_html.body.find('div', attrs={'class':'container'}).text

我想,你不需要性能描述-只要讀一下美之湯的工作原理就行了。看它正式文件.


查看完整回答
反對(duì) 回復(fù) 2019-07-01
  • 3 回答
  • 0 關(guān)注
  • 1389 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)