<ul class="sheshi_zb">
<li class="jiaotong_color"><span>交通</span>公交10路在埠惜路北楊頭站下車;公交106路、120路在遼河一路實(shí)驗(yàn)中學(xué)站下車</li> <li><span>幼兒園</span>楊頭幼兒園</li> <li><span>中小學(xué)</span>即墨市實(shí)驗(yàn)高級(jí)中學(xué)</li> <li><span>大學(xué)</span>即墨廣播電視大學(xué)</li> <li><span>綜合商場(chǎng)</span>利群、佳樂家</li> <li><span>醫(yī)院</span>醫(yī)療中心</li> <li><span>銀行</span>工商銀行、建設(shè)銀行</li> <li><span>郵政</span>郵政儲(chǔ)蓄</li> <li><span>其他</span>龍泉湖公園,盟旺山公園</li> <li><span>小區(qū)內(nèi)部配套</span>快遞柜、超市、老年文化中心</li> </ul>
周邊設(shè)施交通:公交10路在埠惜路北楊頭站下車;公交106路、120路在遼河一路實(shí)驗(yàn)中學(xué)站下車幼兒園:楊頭幼兒園中小學(xué):即墨市實(shí)驗(yàn)高級(jí)中學(xué)大學(xué):即墨廣播電視大學(xué)綜合商場(chǎng):利群、佳樂家醫(yī)院:醫(yī)療中心銀行:工商銀行、建設(shè)銀行郵政:郵政儲(chǔ)蓄其他:龍泉湖公園,盟旺山公園小區(qū)內(nèi)部配套:快遞柜、超市、老年文化中心
這段Html的代碼是一個(gè)ul class="sheshi_zb"中的內(nèi)容 但是分了不同li標(biāo)簽,想把對(duì)應(yīng)的內(nèi)容提取出來(lái)應(yīng)該怎么做呢?
2 回答

慕的地6264312
TA貢獻(xiàn)1817條經(jīng)驗(yàn) 獲得超6個(gè)贊
from bs4 import BeautifulSoup
html = '''
<ul class="sheshi_zb">
<li class="jiaotong_color"><span>交通</span>公交10路在埠惜路北楊頭站下車;公交106路、120路在遼河一路實(shí)驗(yàn)中學(xué)站下車</li>
<li><span>幼兒園</span>楊頭幼兒園</li>
<li><span>中小學(xué)</span>即墨市實(shí)驗(yàn)高級(jí)中學(xué)</li>
<li><span>大學(xué)</span>即墨廣播電視大學(xué)</li>
<li><span>綜合商場(chǎng)</span>利群、佳樂家</li>
<li><span>醫(yī)院</span>醫(yī)療中心</li>
<li><span>銀行</span>工商銀行、建設(shè)銀行</li>
<li><span>郵政</span>郵政儲(chǔ)蓄</li>
<li><span>其他</span>龍泉湖公園,盟旺山公園</li>
<li><span>小區(qū)內(nèi)部配套</span>快遞柜、超市、老年文化中心</li>
</ul>'''
html_text = BeautifulSoup(html, 'lxml')
html2 = html_text.findAll('li')
title = [i.span.get_text() for i in html2]
# text = [i.get_text().lstrip('\n').split('\n') for i in html_text]
text = [i.get_text().lstrip('\n').rstrip('\n').split('\n') for i in html_text]
mydict = dict(zip(title, text[0]))
for i, k in mydict.items():
print('{0}: {1}'.format(i, k))
- 這一段就是把你需要的結(jié)果生成一個(gè)字典。
添加回答
舉報(bào)
0/150
提交
取消