1 回答

TA貢獻(xiàn)1829條經(jīng)驗 獲得超7個贊
就題論題,還包括:
1. Python 數(shù)據(jù)庫連接庫,例如MySQL 連接庫的應(yīng)用,這決定你的數(shù)據(jù)從哪里來。這里面涉及到sql語法和數(shù)據(jù)庫基本知識,是你在學(xué)習(xí)的時候必須一起學(xué)會的。
2. Python 做基本數(shù)據(jù)計算和預(yù)處理的庫,包括numpy ,scipy,pandas 這三個用得最多。
3. 數(shù)據(jù)分析和挖掘庫,主要是sklearn,Statsmodels。前者是最廣泛的機(jī)器學(xué)習(xí)庫,后者是側(cè)重于統(tǒng)計分析的庫。(要知道統(tǒng)計分析大多時候和數(shù)據(jù)挖掘都錯不能分開使用)
4. 圖形展示庫。matpotlib,這是用的最多的了。
說完題主本身 要求,樓上幾位說的對,你還需要一些關(guān)于數(shù)據(jù)挖掘算法的基本知識和認(rèn)知,否則即使你調(diào)用相關(guān)庫得到結(jié)果,很可能你都不知道怎么解讀,如何優(yōu)化,甚至在什么場景下還如何選擇算法等。因此基本知識你得了解。主要包括:
1.統(tǒng)計學(xué)相關(guān),看看深入淺出數(shù)據(jù)分析和漫畫統(tǒng)計學(xué)吧,雖然是入門的書籍,但很容易懂。
2.數(shù)據(jù)挖掘相關(guān),看看數(shù)據(jù)挖掘?qū)д摪?,這是講算法本身得書。
剩下的就是去實踐了。有項目就多參與下項目,看看真正的數(shù)據(jù)挖掘項目是怎么開展的,流程怎樣等。沒有項目可以去參加一些數(shù)據(jù)挖掘或機(jī)器學(xué)習(xí)方面的大賽,也是增加經(jīng)驗得好方法。
- 1 回答
- 0 關(guān)注
- 808 瀏覽
添加回答
舉報