課程
/后端開發(fā)
/Python
/Python數(shù)據(jù)預(yù)處理(二)- 清洗文本數(shù)據(jù)
正則過濾掉特殊符號、標(biāo)點、英文、數(shù)字等這段代碼可以提供一下嗎
2019-07-22
源自:Python數(shù)據(jù)預(yù)處理(二)- 清洗文本數(shù)據(jù) 2-4
正在回答
# 正則對字符串清洗
def textParse(str_doc):
? ? # 正則過濾掉特殊符號、標(biāo)點、英文、數(shù)字等。
? ? r1 = '[a-zA-Z0-9’!"#$%&\'()*+,-./::;;|<=>?@,—。?★、…【】《》?“”‘’![\\]^_`{|}~]+'
? ? # 去除空格
? ? r2 = '\s+'
? ? # 去除換行符
? ? str_doc=re.sub(r1, ' ', str_doc)
? ? # 多個空格成1個
? ? str_doc=re.sub(r2, ' ', str_doc)
? ? # str_doc = str_doc.replace('\n',' ')
? ? return str_doc
舉報
教會你使用Python數(shù)據(jù)預(yù)處理
1 回答老師,代碼有嗎
2 回答源碼能分享下嗎
1 回答怎么沒有源代碼
1 回答原始的word,pdf文件有嗎?
3 回答求源碼下載
Copyright ? 2025 imooc.com All Rights Reserved | 京ICP備12003892號-11 京公網(wǎng)安備11010802030151號
購課補貼聯(lián)系客服咨詢優(yōu)惠詳情
慕課網(wǎng)APP您的移動學(xué)習(xí)伙伴
掃描二維碼關(guān)注慕課網(wǎng)微信公眾號
2019-07-24
# 正則對字符串清洗
def textParse(str_doc):
? ? # 正則過濾掉特殊符號、標(biāo)點、英文、數(shù)字等。
? ? r1 = '[a-zA-Z0-9’!"#$%&\'()*+,-./::;;|<=>?@,—。?★、…【】《》?“”‘’![\\]^_`{|}~]+'
? ? # 去除空格
? ? r2 = '\s+'
? ? # 去除換行符
? ? str_doc=re.sub(r1, ' ', str_doc)
? ? # 多個空格成1個
? ? str_doc=re.sub(r2, ' ', str_doc)
? ? # 去除換行符
? ? # str_doc = str_doc.replace('\n',' ')
? ? return str_doc