輸出的結(jié)果是百度百科Python詞條下的鏈接嗎?
輸出的結(jié)果是百度百科Python詞條(https://baike.baidu.com/item/Python/407313)文章里的鏈接嗎? 好像輸出的結(jié)果很多都已經(jīng)不是“Python”詞條下的鏈接?!靶彺濉倍汲鰜砹?。而很多在此文章里的鏈接卻沒抓到。
這是跟parser的正則表達是有關嗎?用了幾個嘗試,都無法解決
links = soup.find_all('a', href=re.compile(r"/item"))
links = soup.find_all('a', href=re.compile(r"/item/*"))
links = soup.find_all('a', href=re.compile(r'/item/[\\%\\w]+'))
2017-11-21
是的啊