w我現(xiàn)在用python 爬取網(wǎng)頁(yè)內(nèi)用要用到正則表達(dá)式,要爬的內(nèi)容時(shí)這樣的是img中的 src內(nèi)容我用python寫的正則是這樣links = re.findall('<a href=".*?".target=.*?>^[div]<img src="(.*?)".*?>.*?</a>')
可是卻匹配到一些我不想要的 比如怎么改一下正則才能不匹配這個(gè)帶div標(biāo)簽的,謝謝了
1 回答

幕布斯7119047
TA貢獻(xiàn)1794條經(jīng)驗(yàn) 獲得超8個(gè)贊
試試
links = re.findall('<a href=".*?".target=.*?>\s*<img src="(.*?)".*?>\s*</a>')
- 1 回答
- 0 關(guān)注
- 655 瀏覽
添加回答
舉報(bào)
0/150
提交
取消