-
聚類--機(jī)器學(xué)習(xí)的算法=分類查看全部
-
關(guān)聯(lián)規(guī)則--啤酒+紙尿褲查看全部
-
機(jī)器學(xué)習(xí)基礎(chǔ):概率論&統(tǒng)計(jì)學(xué)查看全部
-
機(jī)器學(xué)習(xí)部分算法查看全部
-
機(jī)器學(xué)習(xí):利用計(jì)算機(jī)從歷史數(shù)據(jù)中找出規(guī)律,并把這些規(guī)律用到對(duì)未來(lái)的不確定場(chǎng)景的決策。查看全部
-
算法分類1:根據(jù)數(shù)據(jù)有無(wú)標(biāo)簽Y進(jìn)行分類 對(duì)樣本數(shù)據(jù)進(jìn)行一些訓(xùn)練,得到模型,通過(guò)模型判斷X與Y的關(guān)系。 有監(jiān)督學(xué)習(xí):訓(xùn)練數(shù)據(jù)中已經(jīng)明確給出了該數(shù)據(jù)的Y,給數(shù)據(jù)打上了標(biāo)簽。如:已對(duì)郵件打上了“垃圾郵件”、“正常郵件”的標(biāo)簽。包括:分類算法、回歸算法。 無(wú)監(jiān)督學(xué)習(xí):訓(xùn)練數(shù)據(jù)并沒(méi)有Y,數(shù)據(jù)沒(méi)有任何標(biāo)簽。典型算法:聚類。 半監(jiān)督學(xué)習(xí):也叫強(qiáng)化學(xué)習(xí),數(shù)據(jù)越多,模型越好。 算法分類2:根據(jù)解決問(wèn)題進(jìn)行分類 分類與回歸、聚類、標(biāo)注 算法分類3(重要,直指本質(zhì)) 生成模型:用來(lái)說(shuō)明分類問(wèn)題。返回的是屬于各個(gè)類的概率。 判別模型:用來(lái)說(shuō)明分類問(wèn)題。直接給一個(gè)函數(shù),數(shù)據(jù)輸入到函數(shù)中,直接返回類別。查看全部
-
image2vector 將圖片轉(zhuǎn)變?yōu)橄蛄康乃惴?word2vector 將文本轉(zhuǎn)變?yōu)橄蛄康乃惴?查看全部
-
特征工程:將RGB二進(jìn)制文件轉(zhuǎn)變?yōu)闄C(jī)器學(xué)習(xí)需要的數(shù)據(jù)格式。 圖片存儲(chǔ)是通過(guò)RGB格式進(jìn)行的,每一個(gè)像素點(diǎn)是由3個(gè)數(shù)字組成的(紅、綠、藍(lán))。查看全部
-
解決問(wèn)題:預(yù)測(cè)問(wèn)題(分類、數(shù)值)、聚類問(wèn)題。 步驟: 1、確定目標(biāo):有業(yè)務(wù)需求,確定要解決的問(wèn)題,圍繞該問(wèn)題收集一些數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行特征工程(對(duì)數(shù)據(jù)清洗、整合,重要?。鶕?jù)要解決的問(wèn)題提取出一些特征。查看全部
-
2、訓(xùn)練模型:針對(duì)要解決的問(wèn)題定義一個(gè)模型,再定義損失函數(shù)(就是定義預(yù)測(cè)結(jié)果與真實(shí)結(jié)果怎么去評(píng)價(jià)兩者的相似程度,重點(diǎn)?。?,優(yōu)化算法(損失函數(shù)取最小值,最終變?yōu)榍蠛瘮?shù)極小值的問(wèn)題。重點(diǎn)?。? 損失函數(shù):預(yù)測(cè)結(jié)果與真值存在一定偏差,損失函數(shù)定義的就是偏差的大小。很大情況下是求解不到精確解的,一般都是在尋找一個(gè)近似解,當(dāng)近似解不超過(guò)損失函數(shù)定義的那個(gè)偏差時(shí),就可采納該近似解。 3、模型評(píng)估:交叉驗(yàn)證、效果評(píng)估查看全部
-
常見(jiàn)算法2查看全部
-
C4.5、CART:屬于決策樹算法,既可以解決分類問(wèn)題,也可以解決回歸問(wèn)題。主要解決分類問(wèn)題。屬于有監(jiān)督算法。很少使用。 K-Means:聚類算法,無(wú)監(jiān)督學(xué)習(xí)算法。 SVN:主要解決分類問(wèn)題,最好的分類算法,有完整的數(shù)學(xué)理論。(重要) Apriori:關(guān)聯(lián)分析算法,淘汰,多次訪問(wèn)數(shù)據(jù)庫(kù)代價(jià)高。 FP-Grows:Apriori的升級(jí)版,只需對(duì)數(shù)據(jù)庫(kù)進(jìn)行兩遍掃描。 EM:總的算法框架,不針對(duì)某一具體問(wèn)題。 AdaBoost:決策樹的改進(jìn)版,主要用于人臉識(shí)別,本質(zhì)上解決分類問(wèn)題。屬于有監(jiān)督學(xué)習(xí)。 kNN:分類算法,有監(jiān)督學(xué)習(xí)。與K-Means有點(diǎn)像。 9:垃圾郵件識(shí)別。查看全部
-
算法分類1:根據(jù)數(shù)據(jù)有無(wú)標(biāo)簽Y進(jìn)行分類 對(duì)樣本數(shù)據(jù)進(jìn)行一些訓(xùn)練,得到模型,通過(guò)模型判斷X與Y的關(guān)系。 有監(jiān)督學(xué)習(xí):訓(xùn)練數(shù)據(jù)中已經(jīng)明確給出了該數(shù)據(jù)的Y,給數(shù)據(jù)打上了標(biāo)簽。如:已對(duì)郵件打上了“垃圾郵件”、“正常郵件”的標(biāo)簽。包括:分類算法、回歸算法。 無(wú)監(jiān)督學(xué)習(xí):訓(xùn)練數(shù)據(jù)并沒(méi)有Y,數(shù)據(jù)沒(méi)有任何標(biāo)簽。典型算法:聚類。 半監(jiān)督學(xué)習(xí):也叫強(qiáng)化學(xué)習(xí),數(shù)據(jù)越多,模型越好。 算法分類2:根據(jù)解決問(wèn)題進(jìn)行分類 分類與回歸、聚類、標(biāo)注 算法分類3(重要,直指本質(zhì)) 生成模型:用來(lái)說(shuō)明分類問(wèn)題。返回的是屬于各個(gè)類的概率。 判別模型:用來(lái)說(shuō)明分類問(wèn)題。直接給一個(gè)函數(shù),數(shù)據(jù)輸入到函數(shù)中,直接返回類別。查看全部
-
4、參與者不同 數(shù)據(jù)分析,分析師能力決定結(jié)果,目標(biāo)用戶是公司高層。 機(jī)器學(xué)習(xí),數(shù)據(jù)質(zhì)量決定結(jié)果,目標(biāo)用戶是個(gè)體。查看全部
-
2、解決業(yè)務(wù)問(wèn)題不同 數(shù)據(jù)分析,報(bào)告歷史上發(fā)生的事情。 機(jī)器學(xué)習(xí):通過(guò)歷史上發(fā)生的事情,來(lái)預(yù)測(cè)未來(lái)的事情。查看全部
舉報(bào)
0/150
提交
取消