首頁猿問如何使用正則表達式從獲得通話記錄中...

如何使用正則表達式從獲得通話記錄中提?。〒P聲器、文本）元組？

Python

慕無忌1623718 2021-10-10 15:22:58

對于我的碩士論文，我需要從公司收入電話記錄中提取（演講者、文本）元組。成績單采用以下形式：OPERATOR: Some text with numbers, special characters and linebreaks.NAME, COMPANY, POSITION: Some text with numbers, special characters and linebreaks.NAME: Some text with numbers, special characters and linebreaks.我想從文檔中提取所有（揚聲器、文本）元組。例如：[("OPERATOR", "Some text with numbers, special characters and linebreaks."), ..]到目前為止，我已經用re.findallPython 中的函數(shù)嘗試了不同的正則表達式。這是我的代碼：import re# First approach:r = re.compile(r"^([^a-z:]+?):([\s\S]+?)", flags=re.MULTILINE)re.findall(r, example)# Second approach:r = re.compile(r"^([^a-z:]+?):([\s\S]+)", flags=re.MULTILINE)re.findall(r, example)第一種（非貪婪）方法的問題在于它沒有捕獲說話者的全文。第二種（貪婪）方法的問題在于，它不會在下一個說話者出現(xiàn)時停止。編輯：附加信息文本組也可以包含雙點。在某些情況下，在一行的第一個單詞之后立即出現(xiàn)雙點，例如“For\nexample: ...”演講者組也可以覆蓋多行，例如當公司名稱和職位描述很長時

查看完整描述

1 回答

隔江千里

TA貢獻1906條經驗獲得超10個贊

您可以在不使用的情況下進行匹配，[\s\S]+因為它將匹配包括新行在內的任何字符。

對于第二個捕獲組，您可以匹配.*，然后使用具有負前瞻的重復組，只要以下行不以(?:(?!\n[^a-z\r\n]+:)

^([^a-z\r\n]+):(.*(?:(?!\n[^a-z\r\n]+:)[\r\n].*)*)

反對回復 2021-10-10

1 回答
0 關注
178 瀏覽

關注

添加回答

舉報

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網(wǎng)微信公眾號

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

如何使用正則表達式從獲得通話記錄中提?。〒P聲器、文本）元組？

如何使用正則表達式從獲得通話記錄中提?。〒P聲器、文本）元組？

1 回答

添加回答

如何使用正則表達式從獲得通話記錄中提?。〒P聲器、文本）元組？

如何使用正則表達式從獲得通話記錄中提?。〒P聲器、文本）元組？