-
先有一個(gè)業(yè)務(wù)需求,然后是數(shù)據(jù)收集,最后是特征工程,特征工程工作量大概占70%(數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)清洗),相對于算法提升更容易提高最后成果的質(zhì)量
查看全部 -
機(jī)器學(xué)習(xí):數(shù)據(jù)質(zhì)量決定結(jié)果,不同算法不會造成太大的偏差,目標(biāo)用戶是個(gè)體客戶。
數(shù)據(jù)分析:數(shù)據(jù)分析師的能力及經(jīng)驗(yàn)決定質(zhì)量,目標(biāo)用戶是公司高層。
查看全部 -
什么是機(jī)器學(xué)習(xí)查看全部
-
常見算法一覽
查看全部 -
常見算法列表
查看全部 -
在線機(jī)器學(xué)習(xí)
查看全部 -
特征工程:將文字文本圖片轉(zhuǎn)化為向量形式
特征工程轉(zhuǎn)化之后,做聚類
查看全部 -
數(shù)據(jù)挖掘:關(guān)聯(lián)規(guī)則(關(guān)聯(lián)算法)
案例:啤酒+紙尿褲
查看全部 -
1. 機(jī)器學(xué)習(xí)的典型應(yīng)用
????關(guān)聯(lián)規(guī)則(啤酒+尿片)
????聚類(全球通,動(dòng)感地帶,神州行)
????樸素貝葉斯(垃圾郵件)
????決策樹(信用卡欺詐)
????CTR 預(yù)估(互聯(lián)網(wǎng)廣告)
????協(xié)同過濾(推薦系統(tǒng))
????自然語言處理(情感分析,實(shí)體識別)
????圖像識別(深度學(xué)習(xí))
????更多應(yīng)用……
2. 數(shù)據(jù)分析和機(jī)器學(xué)習(xí)的區(qū)別
(1) 從數(shù)據(jù)角度
交易數(shù)據(jù) vs 行為數(shù)據(jù)
? 交易數(shù)據(jù):銀行存取款賬單;電商用戶訂單;電信運(yùn)營商花費(fèi)賬單
? 行為數(shù)據(jù):搜索歷史,點(diǎn)擊歷史,瀏覽歷史,評論……
少量數(shù)據(jù) vs 海量數(shù)據(jù)
采樣分析 vs 全量分析
(2) 從解決業(yè)務(wù)問題角度
報(bào)告過去的事情 vs 預(yù)測未來的事情
(3) 從技術(shù)手段角度
? 用戶驅(qū)動(dòng),交互式分析 vs 數(shù)據(jù)驅(qū)動(dòng),自動(dòng)進(jìn)行知識發(fā)現(xiàn)
(4) 從參與者角度
? 分析師 vs 數(shù)據(jù)+算法
3. 機(jī)器學(xué)習(xí)算法分類
分類一
監(jiān)督學(xué)習(xí):分類算法(Y類:垃圾郵件,Y值已知;X類:正常郵件),回歸算法
無監(jiān)督學(xué)習(xí):聚類(Y值未知)
半監(jiān)督學(xué)習(xí):小孩子學(xué)走路(Y值逐漸強(qiáng)化)
分類二:
分類與回歸
聚類
標(biāo)注:我在 努力地(副詞)學(xué)習(xí)(動(dòng)詞)《機(jī)器學(xué)習(xí)》(名詞)
分類三(重要):
生成模型
判別模型
查看全部 -
機(jī)器學(xué)習(xí)找規(guī)律查看全部
-
機(jī)器學(xué)習(xí)定義:
利用計(jì)算機(jī)從歷史數(shù)據(jù)鐘找出規(guī)律,并把這些規(guī)律用到對未來不確定場景的決策。
查看全部 -
分類算法同時(shí)也是回歸算法?
??!SVM算法
AdaBoost
Naive Bayes
查看全部 -
機(jī)器學(xué)習(xí)常見算法:
查看全部 -
算法分類:有沒有Y值
有監(jiān)督學(xué)習(xí):(有)訓(xùn)練數(shù)據(jù)被提前打好了標(biāo)簽。典型的就有分類算法和回歸算法。
無監(jiān)督學(xué)習(xí):(沒有)聚類算法。
半監(jiān)督學(xué)習(xí) :強(qiáng)化學(xué)習(xí)。
算法分類:根據(jù)要解決的問題進(jìn)行分類。
分類與回歸
聚類
標(biāo)注
算法分類:算法的本質(zhì)分類。
生成模型
判別模型
查看全部 -
機(jī)器學(xué)習(xí)解決問題的框架:
訓(xùn)練模型:定義模型、定義損失函數(shù)、優(yōu)化算法、模型評估、效果評估
查看全部
舉報(bào)