前些天到網(wǎng)上一段正則,過濾url的代碼如下:importreurl='轉(zhuǎn)載請附帶本文網(wǎng)址:http://www.zhangte.org'P=re.compile('http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+')P.sub('',url)但是這段代碼只可以過濾帶有http的url,如果沒有http,就過濾不了,比如這種url就過濾不了www.zhangte.org所以我修改一下,變成這種正則html="你好www.zhangte.org"P=re.compile('http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+|(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+')P.sub('',html)但是感覺整體邏輯看起來,很亂,我用的是最簡單最粗暴的方式,直接用|,然后把前面的http[s]?://去掉,然后就拼接起來了,勉強(qiáng)可以用,但是感覺看起來太蛋疼了,有比較好的辦法嗎?
跪求高手把這段正則表達(dá)式改得比較簡單一點(diǎn)
不負(fù)相思意
2019-05-23 11:13:01