python中的re可以識別<span>標(biāo)簽嗎
2 回答

偶然的你
TA貢獻(xiàn)1841條經(jīng)驗 獲得超3個贊
這個要看你使用的是什么頁面解析工具了
html = """ <span class='red'>item1</span> <div> <span id='s1'>item2</span> </div> """ # 使用 scrapy 的Selector from scrapy.selector import Selector # scrapy 的選擇器支持 css和xpath選擇。下面是css選擇器。如果你了解前端JQuery的知識, # 會發(fā)現(xiàn) Selector(text = html).css( 'span::text' ).extract() # 輸出 : ['item1','item2'] Selector(text = html).css( 'span#s1::text' ).extract() # 輸出 : ['item2'] Selector(text = html).css( 'div>span::text' ).extract() # 輸出 : ['item2'] # 使用bs4 from bs4 import BeautifulSoup soup = BeautifulSoup(html, 'html.parser' ) sl = soup.find_all( "span" ) result = [span.get_text() for span in sl] print (result) # ['item1', 'item2'] |
添加回答
舉報
0/150
提交
取消