-
機(jī)器學(xué)習(xí)解決問題的框架:確定目標(biāo)、業(yè)務(wù)需求、數(shù)據(jù)、特征工程
查看全部 -
機(jī)器學(xué)習(xí)算法分類
算法分類(1):有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)
算法分類(2):分類與回歸、聚類、標(biāo)注
(重要)算法分類(3):生成模型、判別模型
查看全部 -
交易型數(shù)據(jù)(跟錢有關(guān)系的操作數(shù)據(jù))使用關(guān)系型數(shù)據(jù)庫(kù)(MySQL SQLSEVER)
行為型數(shù)據(jù)使用NOSQL
查看全部 -
什么是機(jī)器學(xué)習(xí):
利用計(jì)算機(jī)從歷史數(shù)據(jù)中找出規(guī)律,并把這些規(guī)律用到對(duì)未來不確定場(chǎng)景的決策
查看全部 -
機(jī)器學(xué)習(xí)解決問題的框架:
二、訓(xùn)練模型
STEP1:定義模型(形成目標(biāo)公式)
STEP2:定義損失函數(shù)(數(shù)學(xué)的方式定義預(yù)測(cè)值與現(xiàn)實(shí)值的差異)
STEP3:優(yōu)化算法(尋找確定損失函數(shù)極小值)
三、模型評(píng)估(標(biāo)準(zhǔn))
STEP1:交叉驗(yàn)證
STEP2:效果評(píng)估
訓(xùn)練模型
(1)定義模型:確定模型,訓(xùn)練出模型的參數(shù)
(2)定義損失函數(shù)(定義偏差的大?。涸u(píng)價(jià)真實(shí)結(jié)果與模型的預(yù)測(cè)結(jié)果的相似程度和差異度。?機(jī)器學(xué)習(xí)解決的問題,有時(shí)不能得到精確解只能尋找近似解。 偏差最小的函數(shù),針對(duì)很大的數(shù)據(jù)集,就是損失函數(shù)。 讓損失函數(shù)求最小,就是優(yōu)化算法。對(duì)于線性回歸模型,計(jì)算預(yù)測(cè)結(jié)果與實(shí)際結(jié)果的差值;對(duì)于分類模型,則需要定義自己的損失函數(shù)
(3)優(yōu)化算法:對(duì)算法進(jìn)行優(yōu)化,使損失函數(shù)取極小值,如梯度下降法......
查看全部 -
機(jī)器學(xué)習(xí)借鑒問題的框架
查看全部 -
機(jī)器學(xué)習(xí)常見算法
查看全部 -
機(jī)器學(xué)習(xí)常見算法
查看全部 -
機(jī)器學(xué)習(xí)算法分類
查看全部 -
機(jī)器學(xué)習(xí)算法分類
查看全部 -
算法分類:
1、監(jiān)督學(xué)習(xí):分類算法、回歸算法
2、無監(jiān)督學(xué)習(xí):聚類
3、半監(jiān)督學(xué)習(xí):主要考慮如何利用少量的標(biāo)注樣本和大量的未標(biāo)注樣本進(jìn)行訓(xùn)練和分類的問題。主要分為半監(jiān)督分類,半監(jiān)督回歸,半監(jiān)督聚類和半監(jiān)督降維算法。
查看全部 -
機(jī)器學(xué)習(xí)算法分類
算法分類1:
有監(jiān)督學(xué)習(xí):提供了Y值(分類)的分類算法和提供了Y值(數(shù)字)的回歸算法
無監(jiān)督學(xué)習(xí):無Y值,聚類算法
半監(jiān)督學(xué)習(xí):先給一部分Y值,以達(dá)到訓(xùn)練的越來越好的目的
算法分類2:
分類與回歸
聚類
標(biāo)注
算法分類3:(重要、直指算法的本質(zhì))
生成模型(告訴你屬于每一類的概率)
判別模型(給你一個(gè)函數(shù),你把數(shù)據(jù)丟給函數(shù),他返回給你一個(gè)結(jié)果就告訴你是哪一類)
查看全部 -
二、解決業(yè)務(wù)問題不同
機(jī)器學(xué)習(xí):預(yù)測(cè)未來事件(未來趨勢(shì))
數(shù)據(jù)分析:報(bào)告過去事件(歷史總結(jié))
三、技術(shù)手段、方法不同
機(jī)器學(xué)習(xí):數(shù)據(jù)挖掘;數(shù)據(jù)(算法)驅(qū)動(dòng);規(guī)模大
數(shù)據(jù)分析:OLAP;用戶驅(qū)動(dòng)(企業(yè)數(shù)據(jù)分析師的經(jīng)驗(yàn)等);規(guī)模小;交互式分析
缺點(diǎn):受限于分析師的經(jīng)驗(yàn),分類的多樣化受限制
四、參與(驅(qū)動(dòng))者不同
機(jī)器學(xué)習(xí):數(shù)據(jù)+算法,數(shù)據(jù)質(zhì)量決定結(jié)果
數(shù)據(jù)分析:數(shù)據(jù)分析師,能力&經(jīng)驗(yàn)決定結(jié)果
五、服務(wù)用戶不同
機(jī)器學(xué)習(xí):個(gè)體用戶
數(shù)據(jù)分析:公司高層
查看全部 -
機(jī)器學(xué)習(xí)和數(shù)據(jù)分析的區(qū)別:
一、數(shù)據(jù)特點(diǎn)不同(數(shù)據(jù)類別、數(shù)據(jù)量、數(shù)據(jù)分析方法)
機(jī)器學(xué)習(xí):行為數(shù)據(jù)(如搜索歷史、瀏覽歷史、點(diǎn)擊歷史、評(píng)論等);海量分析,一致性要求相對(duì)不高;全量分析
數(shù)據(jù)分析:交易數(shù)據(jù)(與錢相關(guān),如用戶訂單、存取款賬單、話費(fèi)賬單等)少量數(shù)據(jù),一致性要求嚴(yán)格(如銀行存取款,數(shù)據(jù)精準(zhǔn));采樣分析
數(shù)據(jù)的特點(diǎn):
交易數(shù)據(jù)vs行為數(shù)據(jù)
少量數(shù)據(jù)vs海量數(shù)據(jù)
采樣分析vs全量分析
交易數(shù)據(jù)要求數(shù)據(jù)一致性高(事務(wù)保證)。
NoSQL 適合存儲(chǔ)行為數(shù)據(jù)(一致性差)
關(guān)系型的 適合存儲(chǔ)交易數(shù)據(jù)(一致性高)查看全部 -
機(jī)器學(xué)習(xí)更多應(yīng)用
查看全部
舉報(bào)