機器學(xué)習(xí)監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)。機器學(xué)習(xí)的本質(zhì)是一個函數(shù)。機器學(xué)習(xí)使用訓(xùn)練好的算法或者函數(shù)對歷史數(shù)據(jù)進行處理,得出我們想要的結(jié)果。根據(jù)結(jié)果的不同,我們把機器學(xué)習(xí)分成以下幾類
如果不在打標記的情況下得出的結(jié)果我們稱之為無監(jiān)督學(xué)習(xí),如聚類和關(guān)聯(lián)規(guī)則
如果提前進行打標記處理,那么就是監(jiān)督學(xué)習(xí)。根據(jù)打標記的數(shù)據(jù)是離散的還是連續(xù)的,我們又進一步分為分類(結(jié)果是有限、離散的)和回歸(結(jié)果是連續(xù)的)。數(shù)據(jù)挖掘和機器學(xué)習(xí)的一般步驟是數(shù)據(jù)預(yù)處理→數(shù)據(jù)建模→結(jié)果驗證,這個工具包具體要結(jié)合自己的論文和實習(xí)進行整理。
如果不在打標記的情況下得出的結(jié)果我們稱之為無監(jiān)督學(xué)習(xí),如聚類和關(guān)聯(lián)規(guī)則
如果提前進行打標記處理,那么就是監(jiān)督學(xué)習(xí)。根據(jù)打標記的數(shù)據(jù)是離散的還是連續(xù)的,我們又進一步分為分類(結(jié)果是有限、離散的)和回歸(結(jié)果是連續(xù)的)。數(shù)據(jù)挖掘和機器學(xué)習(xí)的一般步驟是數(shù)據(jù)預(yù)處理→數(shù)據(jù)建模→結(jié)果驗證,這個工具包具體要結(jié)合自己的論文和實習(xí)進行整理。
2017-08-28
Scikit-learn 是基于Python的數(shù)據(jù)挖掘建模和機器學(xué)習(xí)(監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí))的工具包
他可以方便的實現(xiàn)分類、回歸、聚類、降維常用的操作。具體詳見官網(wǎng)http://scikit-learn.org/stable/#
他可以方便的實現(xiàn)分類、回歸、聚類、降維常用的操作。具體詳見官網(wǎng)http://scikit-learn.org/stable/#
2017-08-28
剩余的代碼
#文件操作
df6=pd.read_csv("文件路徑")
print("CSV:",df6)
df7=pd.read_excel("文件路徑")
print("Excel:",df7)
#文件操作
df6=pd.read_csv("文件路徑")
print("CSV:",df6)
df7=pd.read_excel("文件路徑")
print("Excel:",df7)
2017-08-28
#pandas時間、繪圖、文件操作
#Time Series時間序列,獲取秒
t_exam=pd.date_range("20170301",periods=10,freq="S")
print(t_exam)
#圖表
ts=pd.Series(np.random.randn(1000),index=pd.date_range("20170301",periods=1000))
#print(ts)
ts=ts.cumsum()
from pylab import *
ts.plot()
show()
#Time Series時間序列,獲取秒
t_exam=pd.date_range("20170301",periods=10,freq="S")
print(t_exam)
#圖表
ts=pd.Series(np.random.randn(1000),index=pd.date_range("20170301",periods=1000))
#print(ts)
ts=ts.cumsum()
from pylab import *
ts.plot()
show()
2017-08-28
Anaconda:https://www.continuum.io/downloads
Pycharm(Window):迅雷直接復(fù)制下載 https://download.jetbrains.8686c.com/python/pycharm-community-2017.2.2.exe
Pycharm(Window):迅雷直接復(fù)制下載 https://download.jetbrains.8686c.com/python/pycharm-community-2017.2.2.exe
2017-08-26