最新回答 / 慕村1348781
https://github.com/bainingchao/DataProcess/tree/master/ClearText 點(diǎn)開就能看見源碼
2019-10-27
最新回答 / 海邊落地的愿
老師給了一個(gè)這個(gè)鏈接1 復(fù)旦新聞?wù)Z料下載:鏈接: https://pan.baidu.com/s/1U3CtXRl-2mH24PNEzTcy8w 提取碼: bxtj?
2019-09-16
最新回答 / weixin_慕慕7264533
這個(gè)是列表解析式,這個(gè)part是從后面那個(gè)part過來的,比如 a = [1,2,3]b = [x for x in a],則b也等于[1,2,3]
2019-08-25
最新回答 / 寶慕林452583
print('{t}?***?{i}?\t?docs?has?been?dealed'??????????????????????.format(i=i,?t=time.strftime('%Y-%m-%d?%H:%M:%S',time.localtime())),'\n',catg,':\t',file[:20])file???
2019-08-09
講師回答 / 伏草惟存
# 正則對字符串清洗def textParse(str_doc):? ? # 正則過濾掉特殊符號、標(biāo)點(diǎn)、英文、數(shù)字等。? ? r1 = '[a-zA-Z0-9’!"#$%&\'()*+,-./::;;|<=>?@,—。?★、…【】《》?“”‘’![\\]^_`{|}~]+'? ? # 去除空格? ? r2 = '\s+'? ? # 去除換行符? ? str_doc=re.sub(r1, ' ', str_doc)? ? # 多個(gè)空格成1個(gè)? ? str_doc=re.sub(r2, '...
2019-07-22