-
機器離線
學(xué)習(xí)
查看全部 -
常見算法:FP-Growth ? ? LDA ? ? 邏輯回歸 ??
? ? ? ? ? ? ? ? ?????Word2vector ? ? ? ?RF.GBDT
? ? ? ? ? ? ? ? ? ? ? 推薦算法
查看全部 -
概率論是基石,?統(tǒng)計學(xué)去找規(guī)律 ????傳統(tǒng)的統(tǒng)計學(xué),抽取一定量的樣本然后?進(jìn)行概率統(tǒng)計,然后得到結(jié)論?之后進(jìn)行假設(shè)檢驗 ????傳統(tǒng)的統(tǒng)計學(xué)受運算能力的限制,所以是用抽樣的方式; ????傳統(tǒng)統(tǒng)計:抽樣-描述統(tǒng)計-結(jié)論-假設(shè)檢驗-推斷 求均值 ????統(tǒng)計學(xué):?抽樣,?求均值,?每次結(jié)果可能不一樣 ????機器學(xué)習(xí):?計算機運算能力已經(jīng)提高,?可以進(jìn)行直接運算,?不必抽樣 做數(shù)據(jù)分析要對數(shù)據(jù)進(jìn)行量化,才方便計算、比較。
查看全部 -
機器學(xué)習(xí)常見算法一覽
查看全部 -
FP-Growth,關(guān)聯(lián)分析Apriori的改進(jìn)版,華人發(fā)明的。
邏輯回歸,推薦,搜索結(jié)果的排序。
RF隨機森林,梯度提升決策樹GBDT,與AdaBoost都屬于對決策樹的改進(jìn)。
LDA,文本分析,自然語言處理。
Word2Vector,文本挖掘,最終是一個結(jié)果。
HMM隱馬爾可夫模型,CRF條件隨機場,自然語言處理,文本挖掘。
查看全部 -
各種分類算法
查看全部 -
生成模型:不會明確的告訴結(jié)果Y,而是給出可能結(jié)果的概率
判別模型:給一個X,返回一個明確的Y。
查看全部 -
機器學(xué)習(xí)和數(shù)據(jù)分析的區(qū)別:
1)處理數(shù)據(jù)類型:行為數(shù)據(jù)(搜索歷史、瀏覽歷史等),交易數(shù)據(jù)(與錢相關(guān),有用戶訂單,賬單等)
2)數(shù)據(jù)量:海量數(shù)據(jù),少量數(shù)據(jù)
3)分析方法:全量分析,采樣分析
查看全部 -
生成模型,告訴你屬于各個類的概率,判別模型,像法官直接告訴你結(jié)果,有罪還是無罪
查看全部 -
半監(jiān)督學(xué)習(xí),也叫強化學(xué)習(xí)
查看全部 -
無監(jiān)督學(xué)習(xí),聚類,就是把數(shù)據(jù)分成哪幾類
查看全部 -
有監(jiān)督學(xué)習(xí),數(shù)據(jù)是有標(biāo)簽的,就是這些數(shù)據(jù)是什么類型的數(shù)據(jù),有分類算法和回歸算法等
查看全部 -
機器學(xué)習(xí)解決問題的框架
一、確定目標(biāo)
業(yè)務(wù)需求
數(shù)據(jù)
特征工程(數(shù)據(jù)預(yù)處理,提取特征,很重要,影響最終產(chǎn)出)
二、訓(xùn)練模型
定義模型(參數(shù))
定義損失函數(shù)(預(yù)測結(jié)果和真實結(jié)果之間的差異,關(guān)心的是絕對值或者平方等)
優(yōu)化算法(為了讓損失函數(shù)取最小)
三、模型評估
交叉驗證
效果評估
查看全部 -
機器學(xué)習(xí)解決問題的框架
一、確定目標(biāo)
業(yè)務(wù)需求
數(shù)據(jù)
特征工程(數(shù)據(jù)預(yù)處理,提取特征,很重要,影響最終產(chǎn)出)
查看全部 -
FP-Growth,關(guān)聯(lián)分析Apriori的改進(jìn)版,華人發(fā)明的。
邏輯回歸,推薦,搜索結(jié)果的排序。
RF隨機森林,梯度提升決策樹GBDT,與AdaBoost都屬于對決策樹的改進(jìn)。
LDA,文本分析,自然語言處理。
Wod2Vector,文本挖掘,最終是一個結(jié)果。
HMM隱馬爾可夫模型,CRF條件隨機場,自然語言處理,文本挖掘。
查看全部
舉報