-
重點(diǎn)重點(diǎn)重點(diǎn)重點(diǎn)重點(diǎn)
查看全部 -
1.利用計(jì)算機(jī)從歷史數(shù)據(jù)中找出規(guī)律,并把這些規(guī)律用到對(duì)未來(lái)不確定場(chǎng)景的決策中。?
2.概率論和數(shù)據(jù)分析?
3.原動(dòng)力 自動(dòng)決定 數(shù)據(jù)代替專家 經(jīng)濟(jì)驅(qū)動(dòng)?
4..業(yè)務(wù)系統(tǒng)發(fā)展歷史 基于專家經(jīng)驗(yàn) 基于統(tǒng)計(jì)-分緯度統(tǒng)計(jì) 機(jī)械學(xué)習(xí)-在線學(xué)習(xí)?
5.離線學(xué)習(xí) 在線學(xué)習(xí)?
6.購(gòu)物籃分析 關(guān)聯(lián)規(guī)則 啤酒加尿布?
7.用戶細(xì)分精準(zhǔn)營(yíng)銷 聚類?
8.垃圾郵件 樸素貝葉斯算法?
9.信用卡欺詐 決策樹(shù)?
10.互聯(lián)網(wǎng)廣告 ctr預(yù)估?
11.推薦系統(tǒng) 協(xié)同過(guò)濾?
12.自然語(yǔ)言處理 情感分析 實(shí)體識(shí)別?
13.圖像識(shí)別 深度學(xué)習(xí)?
14.語(yǔ)音識(shí)別 個(gè)性化醫(yī)療 情感分析 人臉識(shí)別 自動(dòng)駕駛 智慧機(jī)械人 私人虛擬助理 手勢(shì)控制 視頻內(nèi)容自動(dòng)識(shí)別 機(jī)械實(shí)時(shí)翻譯?
15.數(shù)據(jù)分析和機(jī)械學(xué)習(xí)的區(qū)別 交易數(shù)據(jù)VS行為數(shù)據(jù) 少量數(shù)據(jù)VS海量數(shù)據(jù) 采樣分析VS全量分析 歷史VS未來(lái) 用戶驅(qū)動(dòng)VS數(shù)據(jù)驅(qū)動(dòng)目標(biāo)用戶公司高層VS普通個(gè)體?
16.算法分類1 有監(jiān)督學(xué)習(xí) 分類算法 回歸算法 無(wú)監(jiān)督學(xué)習(xí) 聚類 半監(jiān)督學(xué)習(xí) 越學(xué)越好?
17.算法分類2 分類與回歸 聚類 標(biāo)注?
18.算法分類3 生成模型 判別模型?
19.常見(jiàn)算法 C4.5 K-Means SVM Apriori EM PageRank AdaBoost kNN NaiveBayes CART FP-Growth LDA 邏輯回歸 RF GBDT Word2Vector HMM CRF 推薦算法 深度學(xué)習(xí)?
20.機(jī)械學(xué)習(xí)解決問(wèn)題的框架 特征工程 損失函數(shù)?
21.案例 圖片按照色彩聚類
查看全部 -
1.機(jī)器學(xué)習(xí)就是利用計(jì)算機(jī)從歷史數(shù)據(jù)中找規(guī)律,把這些規(guī)律用到對(duì)未來(lái)不確定場(chǎng)景的決策?!娟P(guān)鍵詞 不確定因素 判斷 決策 依靠的是計(jì)算機(jī)的歷史數(shù)據(jù)的規(guī)律挖掘】 2.機(jī)器學(xué)習(xí)依靠計(jì)算機(jī) ? 數(shù)據(jù)分析依靠人的經(jīng)驗(yàn) 知識(shí)水平 3.機(jī)器學(xué)習(xí)發(fā)展的原動(dòng)力是 從歷史數(shù)據(jù)找規(guī)律用到對(duì)未來(lái)自動(dòng)做決定 ?用數(shù)據(jù)代替expert【業(yè)務(wù)邏輯】 經(jīng)濟(jì)驅(qū)動(dòng),數(shù)據(jù)變現(xiàn) 4.業(yè)務(wù)系統(tǒng)發(fā)展的歷史:基于專家經(jīng)驗(yàn)->基于統(tǒng)計(jì)(離線學(xué)習(xí))->機(jī)器學(xué)習(xí)(在線學(xué)習(xí)) 5.典型應(yīng)用:關(guān)聯(lián)規(guī)則 算法 【啤酒和紙尿褲】 6.用戶細(xì)分精準(zhǔn)營(yíng)銷:聚類 算法 ?【神州大眾卡,全球通,神州行,動(dòng)感地帶。。。】 7.垃圾郵件:樸素貝葉斯 算法 8.信用卡欺詐:決策樹(shù) 9.互聯(lián)網(wǎng)廣告:ctr預(yù)估【預(yù)測(cè)點(diǎn)擊率進(jìn)行排序】 10.推薦系統(tǒng):協(xié)同過(guò)濾 11.自然語(yǔ)言處理 ?情感分析,實(shí)體識(shí)別 12.圖像識(shí)別:深度學(xué)習(xí) 13.更多應(yīng)用:語(yǔ)音識(shí)別,個(gè)性化醫(yī)療,智慧機(jī)器人,私人虛擬助理,手勢(shì)控制,人臉識(shí)別,自動(dòng)駕駛,視頻內(nèi)容自動(dòng)識(shí)別,機(jī)器實(shí)時(shí)翻譯
查看全部 -
機(jī)器學(xué)習(xí)和數(shù)據(jù)分析的區(qū)別 數(shù)據(jù)特點(diǎn) ?交易數(shù)據(jù)【跟錢(qián)有關(guān)系】【一致性強(qiáng)】 VS 行為數(shù)據(jù)【用戶的歷史行為】【no SQL數(shù)據(jù)庫(kù) 像mongoDB】 ? ? ? ? ?少量數(shù)據(jù) ? ? ? ? ? ? ? VS 海量數(shù)據(jù) ?采樣分析 ? ? ? ? ? ? ? VS 全量分析 15.數(shù)據(jù)分析(OLAP)(報(bào)告過(guò)去的事情) ? ? ? 機(jī)器學(xué)習(xí)(預(yù)測(cè)未來(lái)的事情) 16.機(jī)器學(xué)習(xí)算法分類 ?有監(jiān)督學(xué)習(xí)【已經(jīng)打上標(biāo)簽】 無(wú)監(jiān)督學(xué)習(xí)【聚類 自己推測(cè)標(biāo)簽】 ?半監(jiān)督學(xué)習(xí) ? ? ? ? ?根據(jù)內(nèi)容: ? ? 分類與回歸 ? ?聚類 ? ? ? 標(biāo)注 ? ? ? ? ?很重要: ? ? ? 生成模型【告訴你樣本屬于哪個(gè)類的概率】 ? ? ?判別模型 【告訴你結(jié)果】 17.分類 C4.5 ? 聚類 K-Means ? 統(tǒng)計(jì)學(xué)習(xí) ?SVM ? 關(guān)聯(lián)分析 ?Apriori 【基本淘汰 代價(jià)太大】 ? 統(tǒng)計(jì)學(xué)習(xí) ?EM ? 鏈接挖掘 ?PageRank ?【谷歌】 ? 集裝與推進(jìn) AdaBoost [人臉識(shí)別] ? 分類 ?kNN ? ? Naive Bayes ?CART ? 高級(jí)算法: FP-Growth ?邏輯回歸 ?RF GBDT 推薦算法 LDA ?Word2Vector ?HMM CRF 深度學(xué)習(xí) 18.機(jī)器學(xué)習(xí)解決問(wèn)題 ? ? 確定目標(biāo): 業(yè)務(wù)需求 ?收集數(shù)據(jù) ? ? ?特征工程【70%】 ? 訓(xùn)練模型: 定義模型-產(chǎn)生公式(根據(jù)具體要解決的問(wèn)題) ?定義損失函數(shù)(預(yù)測(cè)的結(jié)果與真實(shí)的結(jié)果之間的偏差最小的函數(shù)) ?優(yōu)化算法(使損失函數(shù)取極小值) ? 模型評(píng)估: 交叉驗(yàn)證 ? 效果評(píng)估 19.圖片中的每一個(gè)像素點(diǎn)是以一個(gè)rgb來(lái)存的red,green,blue來(lái)表示每個(gè)成分有多大來(lái)存 的,每個(gè)圖是一個(gè)二進(jìn)制的文件 20.K-Means聚類的算法,特征工程就是將圖片以向量或是其他的形式來(lái)表示的
查看全部 -
機(jī)器學(xué)習(xí)解決問(wèn)題的框架2:
訓(xùn)練模型
(1)定義模型:確定模型,訓(xùn)練出模型的參數(shù)
(2)定義損失函數(shù)(定義偏差的大?。涸u(píng)價(jià)真實(shí)結(jié)果與模型的預(yù)測(cè)結(jié)果的相似程度和差異度。?機(jī)器學(xué)習(xí)解決的問(wèn)題,有時(shí)不能得到精確解只能尋找近似解。 偏差最小的函數(shù),針對(duì)很大的數(shù)據(jù)集,就是損失函數(shù)。 讓損失函數(shù)求最小,就是優(yōu)化算法。對(duì)于線性回歸模型,計(jì)算預(yù)測(cè)結(jié)果與實(shí)際結(jié)果的差值;對(duì)于分類模型,則需要定義自己的損失函數(shù)
(3)優(yōu)化算法:對(duì)算法進(jìn)行優(yōu)化,使損失函數(shù)取極小值,如梯度下降法......
查看全部 -
監(jiān)督式學(xué)習(xí):分類,回歸 非監(jiān)督式學(xué)習(xí):聚類 標(biāo)注 邏輯回歸與樸素貝葉斯本質(zhì)區(qū)別:生成模型與判別模型的區(qū)別 生成模型->估計(jì)的是聯(lián)合概率分布 判別模型->估計(jì)的是條件概率分布 監(jiān)督式學(xué)習(xí):分類,回歸 分類 C4.5 聚類 K-Means 統(tǒng)計(jì)學(xué)習(xí)SVM 關(guān)聯(lián)分析fp-growth RF 深度學(xué)習(xí) 業(yè)務(wù)需求->數(shù)據(jù)->特征工程 定義模型->定義損失函數(shù)->優(yōu)化算法->交叉驗(yàn)證
查看全部 -
利用計(jì)算機(jī)從歷史數(shù)據(jù)中找出規(guī)律,并把這些規(guī)律用到對(duì)未來(lái)不確定場(chǎng)景的決策。
查看全部 -
邏輯回歸 百度搜索引擎推薦結(jié)果的排序
rf 決策樹(shù)算法的改進(jìn)
推薦算法
lda 文本分析自然語(yǔ)言的處理
word2vector文本挖掘
深度學(xué)習(xí) 圖像識(shí)別
查看全部 -
傳統(tǒng)的統(tǒng)計(jì)學(xué)
查看全部 -
機(jī)器學(xué)習(xí)課程小結(jié)
查看全部 -
機(jī)器學(xué)習(xí)解決問(wèn)題框架
模型評(píng)估
????? ? 交叉驗(yàn)證
????????效果評(píng)估
其中訓(xùn)練模型中的損失函數(shù)定義和優(yōu)化算法是最為困難的。
查看全部 -
機(jī)器學(xué)習(xí)解決問(wèn)題框架
????訓(xùn)練模型
????????定義模型
????????定義損失函數(shù)
????????優(yōu)化算法
查看全部 -
機(jī)器學(xué)習(xí)解決問(wèn)題框架三步走:
1確定目標(biāo)
????業(yè)務(wù)需求
????數(shù)據(jù)
????特征工程
查看全部 -
int?main() { ????good; }
查看全部 -
訓(xùn)練模型:定義模型、{定義損失函數(shù)、優(yōu)化算法}(難、有趣的地方)
模型評(píng)估:交叉評(píng)估、效果評(píng)估
查看全部
舉報(bào)