第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何使用正則表達式從獲得通話記錄中提?。〒P聲器、文本)元組?

如何使用正則表達式從獲得通話記錄中提?。〒P聲器、文本)元組?

慕無忌1623718 2021-10-10 15:22:58
對于我的碩士論文,我需要從公司收入電話記錄中提取(演講者、文本)元組。成績單采用以下形式:OPERATOR: Some text with numbers, special characters and linebreaks.NAME, COMPANY, POSITION: Some text with numbers, special characters and linebreaks.NAME: Some text with numbers, special characters and linebreaks.我想從文檔中提取所有(揚聲器、文本)元組。例如:[("OPERATOR", "Some text with numbers, special characters and linebreaks."), ..]到目前為止,我已經用re.findallPython 中的函數(shù)嘗試了不同的正則表達式。這是我的代碼:import re# First approach:r = re.compile(r"^([^a-z:]+?):([\s\S]+?)", flags=re.MULTILINE)re.findall(r, example)# Second approach:r = re.compile(r"^([^a-z:]+?):([\s\S]+)", flags=re.MULTILINE)re.findall(r, example)第一種(非貪婪)方法的問題在于它沒有捕獲說話者的全文。第二種(貪婪)方法的問題在于,它不會在下一個說話者出現(xiàn)時停止。編輯:附加信息文本組也可以包含雙點。在某些情況下,在一行的第一個單詞之后立即出現(xiàn)雙點,例如“For\nexample: ...”演講者組也可以覆蓋多行,例如當公司名稱和職位描述很長時
查看完整描述

1 回答

?
隔江千里

TA貢獻1906條經驗 獲得超10個贊

您可以在不使用的情況下進行匹配,[\s\S]+因為它將匹配包括新行在內的任何字符。

對于第二個捕獲組,您可以匹配.*,然后使用具有負前瞻的重復組,只要以下行不以(?:(?!\n[^a-z\r\n]+:)

^([^a-z\r\n]+):(.*(?:(?!\n[^a-z\r\n]+:)[\r\n].*)*)


查看完整回答
反對 回復 2021-10-10
  • 1 回答
  • 0 關注
  • 178 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網(wǎng)微信公眾號