成人国产精品秘?免费观看,七猫精品AV网站

首頁免費(fèi)課 Python數(shù)據(jù)預(yù)處理（二）- 清洗文本數(shù)據(jù) 問答

Python數(shù)據(jù)預(yù)處理（二）- 清洗文本數(shù)據(jù)

                
                伏草惟存
            算法工程師

                    查看講師更多課程 
                    伏草惟存講師的其他課程
                
Python數(shù)據(jù)預(yù)處理（四）- 特征降維與可視化
初級·6954
免費(fèi)課程
                                
Python數(shù)據(jù)預(yù)處理（三）- 文本特征向量化
初級·5171
免費(fèi)課程
                                
Python數(shù)據(jù)預(yù)處理（一）一抽取多源數(shù)據(jù)文本信息
初級·16199
免費(fèi)課程
                                
自然語言處理（NLP）入門與實踐
初級·14974
免費(fèi)課程
                                
                難度中級
            
                時長 3小時48分
            
                學(xué)習(xí)人數(shù)
            
綜合評分8.43
                            12人評價
                        查看評價
                                9.5
                                內(nèi)容實用
                            
                                7.8
                                簡潔易懂
                            
                                8.0
                                邏輯清晰

全部評論問答未解決精華

源碼能分享下嗎

最贊回答 / 寶慕林452583

https://github.com/bainingchao/DataProcess

2 回答 1077 瀏覽 1-7 清洗HTML網(wǎng)頁數(shù)據(jù)

2019-11-13

老師，代碼有嗎

最新回答 / 慕村1348781

https://github.com/bainingchao/DataProcess/tree/master/ClearText 點(diǎn)開就能看見源碼

1 回答 826 瀏覽 1-5 正則表達(dá)式介紹與常見使用場景（1）

2019-10-27

停用詞列表從哪兒下載？

+ 我來回答回答最高可+2積分

2 回答 1376 瀏覽 2-4 自定義去停用詞

2019-09-17

30萬條新聞數(shù)據(jù)

最新回答 / 海邊落地的愿

老師給了一個這個鏈接1 復(fù)旦新聞?wù)Z料下載：鏈接: https://pan.baidu.com/s/1U3CtXRl-2mH24PNEzTcy8w 提取碼: bxtj?

1 回答 951 瀏覽 2-1 jieba分詞精講(1)

2019-09-16

輸出無結(jié)果

最新回答 / 慕夢前來

你是怎么寫的輸出呢？看一下代碼

1 回答 622 瀏覽 1-7 清洗HTML網(wǎng)頁數(shù)據(jù)

2019-09-16

分詞并發(fā)去除停用詞

最新回答 / weixin_慕慕7264533

這個是列表解析式，這個part是從后面那個part過來的，比如 a = [1,2,3]b = [x for x in a]，則b也等于[1,2,3]

1 回答 888 瀏覽 2-4 自定義去停用詞

2019-08-25

老師，最后一集沒有了一部分，怕錯時突然沒有了？

最新回答 / woodskin

修改之后時間還是0.00

2 回答 920 瀏覽 2-10 實戰(zhàn)案例：30萬新聞文本特征提取

2019-08-25

在運(yùn)行時出現(xiàn)這個ExceptionInInitializerError錯誤，是因為什么呢？

最新回答 / 慕勒4408313

我的問題解決方法是路徑中的\符號改為/符號即可。

3 回答 6460 瀏覽 2-3 HanLP分詞精講

2019-08-12

結(jié)果打印不出來

最新回答 / 寶慕林452583

print('{t}?***?{i}?\t?docs?has?been?dealed'??????????????????????.format(i=i,?t=time.strftime('%Y-%m-%d?%H:%M:%S',time.localtime())),'\n',catg,':\t',file[:20])file???

2 回答 809 瀏覽 1-9 批量清洗30萬新聞文本數(shù)據(jù)

2019-08-09

工具包下載

最新回答 / AI人工智能AI

https://github.com/bainingchao/DataProcess

2 回答 526 瀏覽 1-8 簡繁字體轉(zhuǎn)換

2019-08-08

怎么沒有源代碼

講師回答 / 伏草惟存

https://github.com/bainingchao/DataProcess

1 回答 918 瀏覽 1-2 yield生成器實現(xiàn)斐波那契數(shù)列

2019-08-04

求源碼下載

講師回答 / 伏草惟存

https://github.com/bainingchao/PyDataPreprocessing

3 回答 820 瀏覽 2-6 NLTK詞頻統(tǒng)計（2）

2019-07-25

sklearn中tf-idf中結(jié)果的（0，10）的10是什么意思？

講師回答 / 伏草惟存

表示該文檔類別下某個詞的概率。其中10代表這個特征詞的所在位置的序號

1 回答 1040 瀏覽 2-9 slearn計算多分類下的TFIDF

2019-07-23

正則過濾掉特殊符號、標(biāo)點(diǎn)、英文、數(shù)字等這段代碼可以提供一下嗎

講師回答 / 伏草惟存

# 正則對字符串清洗def textParse(str_doc):? ? # 正則過濾掉特殊符號、標(biāo)點(diǎn)、英文、數(shù)字等。? ? r1 = '[a-zA-Z0-9’!"#$%&\'()*+,-./:：;；|<=>?@，—。?★、…【】《》？“”‘’！[\\]^_`{|}~]+'? ? # 去除空格? ? r2 = '\s+'? ? # 去除換行符? ? str_doc=re.sub(r1, ' ', str_doc)? ? # 多個空格成1個? ? str_doc=re.sub(r2, '...

1 回答 1758 瀏覽 2-4 自定義去停用詞

2019-07-22

NLP 分詞NLPTokenizer運(yùn)行報錯，其他的正常

講師回答 / 伏草惟存

你可以借助jiagu或者jieba分詞，性能都差不多。

1 回答 1950 瀏覽 2-3 HanLP分詞精講

2019-07-17

開始學(xué)習(xí)

課程須知: 1、本課程面向一定編程基礎(chǔ)的計算機(jī)專業(yè)、軟件工程專業(yè)、通信專業(yè)、電子技術(shù)專業(yè)和自動化專業(yè)的學(xué)生。 2、本課程也適用于大數(shù)據(jù)從業(yè)者及人工智能相關(guān)工程人員。 3、任何有興趣的同學(xué)均適合學(xué)習(xí)。

老師告訴你能學(xué)到什么？: 1、掌握不同分詞工具與適用場景 2、掌握文本特征選擇與提取方法

微信掃碼，參與3人拼團(tuán)

熱搜

最近搜索清空

Python數(shù)據(jù)預(yù)處理（二）- 清洗文本數(shù)據(jù)