<ul class="sheshi_zb">
<li class="jiaotong_color"><span>交通</span>公交10路在埠惜路北楊頭站下車;公交106路、120路在遼河一路實驗中學站下車</li> <li><span>幼兒園</span>楊頭幼兒園</li> <li><span>中小學</span>即墨市實驗高級中學</li> <li><span>大學</span>即墨廣播電視大學</li> <li><span>綜合商場</span>利群、佳樂家</li> <li><span>醫(yī)院</span>醫(yī)療中心</li> <li><span>銀行</span>工商銀行、建設銀行</li> <li><span>郵政</span>郵政儲蓄</li> <li><span>其他</span>龍泉湖公園,盟旺山公園</li> <li><span>小區(qū)內(nèi)部配套</span>快遞柜、超市、老年文化中心</li> </ul>
周邊設施交通:公交10路在埠惜路北楊頭站下車;公交106路、120路在遼河一路實驗中學站下車幼兒園:楊頭幼兒園中小學:即墨市實驗高級中學大學:即墨廣播電視大學綜合商場:利群、佳樂家醫(yī)院:醫(yī)療中心銀行:工商銀行、建設銀行郵政:郵政儲蓄其他:龍泉湖公園,盟旺山公園小區(qū)內(nèi)部配套:快遞柜、超市、老年文化中心
這段Html的代碼是一個ul class="sheshi_zb"中的內(nèi)容 但是分了不同li標簽,想把對應的內(nèi)容提取出來應該怎么做呢?
2 回答

慕的地6264312
TA貢獻1817條經(jīng)驗 獲得超6個贊
from bs4 import BeautifulSoup
html = '''
<ul class="sheshi_zb">
<li class="jiaotong_color"><span>交通</span>公交10路在埠惜路北楊頭站下車;公交106路、120路在遼河一路實驗中學站下車</li>
<li><span>幼兒園</span>楊頭幼兒園</li>
<li><span>中小學</span>即墨市實驗高級中學</li>
<li><span>大學</span>即墨廣播電視大學</li>
<li><span>綜合商場</span>利群、佳樂家</li>
<li><span>醫(yī)院</span>醫(yī)療中心</li>
<li><span>銀行</span>工商銀行、建設銀行</li>
<li><span>郵政</span>郵政儲蓄</li>
<li><span>其他</span>龍泉湖公園,盟旺山公園</li>
<li><span>小區(qū)內(nèi)部配套</span>快遞柜、超市、老年文化中心</li>
</ul>'''
html_text = BeautifulSoup(html, 'lxml')
html2 = html_text.findAll('li')
title = [i.span.get_text() for i in html2]
# text = [i.get_text().lstrip('\n').split('\n') for i in html_text]
text = [i.get_text().lstrip('\n').rstrip('\n').split('\n') for i in html_text]
mydict = dict(zip(title, text[0]))
for i, k in mydict.items():
print('{0}: {1}'.format(i, k))
- 這一段就是把你需要的結(jié)果生成一個字典。
添加回答
舉報
0/150
提交
取消