首頁猿問用bs4如何把這段html代碼中的...

用bs4如何把這段html代碼中的各個項點提取出來呢？

Python

蕪湖不蕪 2019-02-20 13:06:36

<ul class="sheshi_zb"> <li class="jiaotong_color">交通公交10路在埠惜路北楊頭站下車；公交106路、120路在遼河一路實驗中學站下車</li> <li>幼兒園楊頭幼兒園</li> <li>中小學即墨市實驗高級中學</li> <li>大學即墨廣播電視大學</li> <li>綜合商場利群、佳樂家</li> <li>醫(yī)院醫(yī)療中心</li> <li>銀行工商銀行、建設銀行</li> <li>郵政郵政儲蓄</li> <li>其他龍泉湖公園，盟旺山公園</li> <li>小區(qū)內(nèi)部配套快遞柜、超市、老年文化中心</li> </ul> 周邊設施交通：公交10路在埠惜路北楊頭站下車；公交106路、120路在遼河一路實驗中學站下車幼兒園：楊頭幼兒園中小學：即墨市實驗高級中學大學：即墨廣播電視大學綜合商場：利群、佳樂家醫(yī)院：醫(yī)療中心銀行：工商銀行、建設銀行郵政：郵政儲蓄其他：龍泉湖公園，盟旺山公園小區(qū)內(nèi)部配套：快遞柜、超市、老年文化中心這段Html的代碼是一個ul class="sheshi_zb"中的內(nèi)容但是分了不同li標簽，想把對應的內(nèi)容提取出來應該怎么做呢？

查看完整描述

2 回答

慕的地6264312

TA貢獻1817條經(jīng)驗獲得超6個贊

from bs4 import BeautifulSoup

html = '''
<ul class="sheshi_zb">
    <li class="jiaotong_color"><span>交通</span>公交10路在埠惜路北楊頭站下車；公交106路、120路在遼河一路實驗中學站下車</li>
    <li><span>幼兒園</span>楊頭幼兒園</li>
    <li><span>中小學</span>即墨市實驗高級中學</li>
    <li><span>大學</span>即墨廣播電視大學</li>
    <li><span>綜合商場</span>利群、佳樂家</li>
    <li><span>醫(yī)院</span>醫(yī)療中心</li>
    <li><span>銀行</span>工商銀行、建設銀行</li>
    <li><span>郵政</span>郵政儲蓄</li>
    <li><span>其他</span>龍泉湖公園，盟旺山公園</li>
    <li><span>小區(qū)內(nèi)部配套</span>快遞柜、超市、老年文化中心</li>
</ul>'''

html_text = BeautifulSoup(html, 'lxml')

html2 = html_text.findAll('li')

title = [i.span.get_text() for i in html2]

# text = [i.get_text().lstrip('\n').split('\n') for i in html_text]
text = [i.get_text().lstrip('\n').rstrip('\n').split('\n') for i in html_text]

mydict = dict(zip(title, text[0]))

for i, k in mydict.items():
    print('{0}: {1}'.format(i, k))