我有一個(gè)正則表達(dá)式模式,用于標(biāo)識(shí)一整列日期中的日期,但有些日期包含在一個(gè)字符串中,而有些則只是簡(jiǎn)單的日期本身。我的正則表達(dá)式模式完美地找到了每個(gè)日期,但現(xiàn)在我想能夠說(shuō)“刪除不符合日期模式的所有內(nèi)容”,這將刪除某些日期之前或之后的文本。我想要的東西的例子:Mexico [12/20/1985] 如果我可以刪除與模式不匹配的內(nèi)容,那么括號(hào)和墨西哥就會(huì)消失假設(shè)我的正則表達(dá)式模式是(我還有兩個(gè)匹配更具體的日期格式,但不包括它們,因?yàn)檫@無(wú)關(guān)緊要:pattern = (r"(19|20)\d\d")我正在使用has_date = data.str.contains(pattern),它可以完美地找到我要找的東西。但是,現(xiàn)在我已經(jīng)確定了具有我想要的日期的觀察結(jié)果,我需要去除/刪除/替換所有不是那種模式的東西。我制作了一個(gè)文件,其中包含與正則表達(dá)式模式不匹配的內(nèi)容以及匹配的內(nèi)容,并檢查以確保我的正則表達(dá)式模式包含所有內(nèi)容,因此我在這方面做得很好。有人對(duì)如何替換不是我的模式有任何建議嗎?歡迎任何想法。謝謝
刪除所有與 Python 中的正則表達(dá)式模式不匹配的內(nèi)容
尚方寶劍之說(shuō)
2021-12-21 10:47:38