第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

在 Python 數(shù)據(jù)框中通過 RegEx 刪除不同的文本短語

在 Python 數(shù)據(jù)框中通過 RegEx 刪除不同的文本短語

慕工程0101907 2021-09-28 20:39:40
基本上,我想刪除嵌入在我的文本數(shù)據(jù)中的某些短語模式:以大寫字母開頭,以 Em Dash "—" 結(jié)尾以 Em Dash "—" 開頭并以 "Read Next" 結(jié)尾說,我有以下數(shù)據(jù):宿務(wù)市——被殺的人權(quán)律師的遺孀......引用了 NUPL 的數(shù)據(jù),該數(shù)據(jù)顯示過去兩年有 34 名律師被殺。— JULIE M. AURELIO 和 DJ YAP 的報告閱讀下一個和菲律賓馬尼拉——總統(tǒng)……但正義最終會突破他們的有罪不罰之墻,……——來自 MELVIN GASCON、JULIE M. AURELIO、DELFIN T. MALLARI JR.、JEROME ANING、JOVIC YEE、GABRIEL 的報道PABICO LALU、PATHRICIA ANN V. ROXAS、DJ YAP、法新社、APRead Next我想刪除以下短語:“宿霧城——”“—來自朱莉 M.奧雷利奧和 DJ YAP 的報告閱讀下一個”“菲律賓馬尼拉-”“——來自 MELVIN GASCON、JULIE M. AURELIO、DELFIN T. MALLARI JR.、JEROME ANING、JOVIC YEE、GABRIEL PABICO LALU、PATHRICIA ANN V. ROXAS、DJ YAP、法新社、APRead Next 的報道”我假設(shè)上面列舉的每個模式都需要兩個正則表達式。regex:—[A-Z].*Read Next\s*$可能適用于模式#2,但僅當(dāng)文本數(shù)據(jù)中沒有其他破折號時才有效。當(dāng)模式 #1 出現(xiàn)時它不會工作,因為它會從它看到的第一個 em 破折號中刪除塊,直到“ Read Next ”字符串。我已經(jīng)為模式 #1 嘗試了以下正則表達式:^[A-Z]([A-Za-z]).+(—)$但是怎么就不行了。該正則表達式應(yīng)該查找以任何大寫字母開頭的短語,然后是任何長度的字符串,只要它以“—”結(jié)尾。
查看完整描述

2 回答

?
九州編程

TA貢獻1785條經(jīng)驗 獲得超4個贊

您正在考慮的連字符-實際上并不是連字符,而是稱為Em Dash,因此您需要使用此正則表達式,它在開始時使用 em 破折號而不是連字符,

^—[A-Z].*Read Next\s*$

這是這個正則表達式的解釋,

  • ^ --> 開始輸入

  • --> 匹配Em DashUnicode 十進制代碼為 8212的文字

  • [A-Z] --> 匹配一個大寫字母

  • .* --> 匹配任意字符零次或多次

  • Read Next --> 匹配這些文字

  • \s* --> 這是為了匹配任何可能出現(xiàn)在行尾的可選空白

  • $ --> 輸入結(jié)束


查看完整回答
反對 回復(fù) 2021-09-28
?
ITMISS

TA貢獻1871條經(jīng)驗 獲得超8個贊

應(yīng)該處理這個的正則表達式 -

^—[A-Z]+(.)*(Read Next)$

你可以嘗試在你的數(shù)據(jù)上實現(xiàn)這個正則表達式,看看它是否有效。


查看完整回答
反對 回復(fù) 2021-09-28
  • 2 回答
  • 0 關(guān)注
  • 208 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號