-
1,10是決策樹,解決分類或回歸 2.重要,無監(jiān)督 3.主要解決分類,svm,過程基于數(shù)學(xué),統(tǒng)計(jì)學(xué)理論,無論表現(xiàn)還是解釋都很好??赡苊嬖嚬贂?huì)考推導(dǎo) 4.已淘汰,代價(jià)高,由fp-growth代替,掃描數(shù)據(jù)庫次數(shù)較少 5.比較抽象的總的算法框架 6.谷歌運(yùn)用 7.人臉識(shí)別,決策樹的改進(jìn)版 8.簡單的分類 9.垃圾識(shí)別 1.4.10現(xiàn)在不用了查看全部
-
算法分類1:根據(jù)數(shù)據(jù)有無標(biāo)簽Y進(jìn)行分類 對樣本數(shù)據(jù)進(jìn)行一些訓(xùn)練,得到模型,通過模型判斷X與Y的關(guān)系。 有監(jiān)督學(xué)習(xí):訓(xùn)練數(shù)據(jù)中已經(jīng)明確給出了該數(shù)據(jù)的Y,給數(shù)據(jù)打上了標(biāo)簽。如:已對郵件打上了“垃圾郵件”、“正常郵件”的標(biāo)簽。包括:分類算法、回歸算法。 無監(jiān)督學(xué)習(xí):訓(xùn)練數(shù)據(jù)并沒有Y,數(shù)據(jù)沒有任何標(biāo)簽。典型算法:聚類。 半監(jiān)督學(xué)習(xí):也叫強(qiáng)化學(xué)習(xí),數(shù)據(jù)越多,模型越好。 算法分類2:根據(jù)解決問題進(jìn)行分類 分類與回歸、聚類、標(biāo)注 算法分類3(重要,直指本質(zhì)) 生成模型:用來說明分類問題。返回的是屬于各個(gè)類的概率。 判別模型:用來說明分類問題。直接給一個(gè)函數(shù),數(shù)據(jù)輸入到函數(shù)中,直接返回類別。查看全部
-
2、解決業(yè)務(wù)問題不同 數(shù)據(jù)分析,報(bào)告歷史上發(fā)生的事情。 機(jī)器學(xué)習(xí):通過歷史上發(fā)生的事情,來預(yù)測未來的事情。 3、技術(shù)手段不同 數(shù)據(jù)分析:分析方式是用戶(數(shù)據(jù)分析師)驅(qū)動(dòng)的,交互式分析。分析能力受限于數(shù)據(jù)分析師的能力,數(shù)據(jù)屬性和維度很有限。 機(jī)器學(xué)習(xí):分析方式是數(shù)據(jù)驅(qū)動(dòng)的,自動(dòng)進(jìn)行知識(shí)發(fā)現(xiàn)。數(shù)據(jù)屬性和維度數(shù)量級很大。 4、參與者不同 數(shù)據(jù)分析,分析師能力決定結(jié)果,目標(biāo)用戶是公司高層。 機(jī)器學(xué)習(xí),數(shù)據(jù)質(zhì)量決定結(jié)果,目標(biāo)用戶是個(gè)體。查看全部
-
1、數(shù)據(jù)特點(diǎn) ①交易數(shù)據(jù)vs行為數(shù)據(jù) 數(shù)據(jù)分析處理的是交易數(shù)據(jù),機(jī)器學(xué)習(xí)處理的是行為數(shù)據(jù)。 交易數(shù)據(jù):存取款賬單、用戶訂單、話費(fèi)賬單...與錢有關(guān)的數(shù)據(jù)。對數(shù)據(jù)一致性要求很高,應(yīng)該放在關(guān)系型數(shù)據(jù)庫中。 行為數(shù)據(jù):搜索歷史、點(diǎn)擊歷史、瀏覽歷史、評論...對數(shù)據(jù)一致性要求不是很高,放在NoSQL數(shù)據(jù)庫中。 ②少量數(shù)據(jù)vs海量數(shù)據(jù) ③采樣分析vs全量分析 NoSQL:只能處理行為數(shù)據(jù),不能處理交易數(shù)據(jù)。強(qiáng)調(diào)分布式、CAP,保證數(shù)據(jù)吞吐量的前提下,在數(shù)據(jù)的一致性上打折扣。查看全部
-
機(jī)器學(xué)習(xí)和數(shù)據(jù)分析的區(qū)別 數(shù)據(jù)特點(diǎn): 交易數(shù)據(jù):錢 vs 行為數(shù)據(jù):搜索歷史,點(diǎn)擊歷史,瀏覽歷史,評論 少量數(shù)據(jù) vs 海量數(shù)據(jù) 采量數(shù)據(jù) vs 全量數(shù)據(jù) Not only SQL :處理行為數(shù)據(jù)(分布式)查看全部
-
什么是機(jī)器學(xué)習(xí)? 利用計(jì)算機(jī)從歷史數(shù)據(jù)中找出規(guī)律;并把這些規(guī)律用到對未來不定場景的決策 機(jī)器學(xué)習(xí)的典型應(yīng)用 關(guān)聯(lián)規(guī)則:啤酒+紙尿片,購物籃分析 聚類:用戶細(xì)分精準(zhǔn)營銷 樸素貝葉斯:垃圾郵件檢測 決策樹:風(fēng)險(xiǎn)識(shí)別 ctr預(yù)估:互聯(lián)網(wǎng)廣告:百度的前多少個(gè)詞條(商業(yè)廣告)(按照點(diǎn)擊率排序) 協(xié)同過濾:推薦系統(tǒng)(淘寶購物車推薦) 自然語言處理:情感分析(對文本抓關(guān)鍵情感詞),實(shí)體識(shí)別(提取文本主要數(shù)據(jù),人名等) 深度學(xué)習(xí):圖像識(shí)別 更多應(yīng)用:語音識(shí)別,人臉識(shí)別,手勢控制,智慧機(jī)器人,實(shí)時(shí)翻譯查看全部
-
7、自然語言處理(比機(jī)器學(xué)習(xí)高一個(gè)臺(tái)階) 情感分析、實(shí)體識(shí)別 8、圖像識(shí)別 深度學(xué)習(xí) 利用計(jì)算機(jī)從歷史數(shù)據(jù)中找出規(guī)律;并把這些規(guī)律用到對未來不定場景的決策 機(jī)器學(xué)習(xí)的典型應(yīng)用 關(guān)聯(lián)規(guī)則:啤酒+紙尿片,購物籃分析 聚類:用戶細(xì)分精準(zhǔn)營銷 樸素貝葉斯:垃圾郵件檢測 決策樹:風(fēng)險(xiǎn)識(shí)別 ctr預(yù)估:互聯(lián)網(wǎng)廣告:百度的前多少個(gè)詞條(商業(yè)廣告)(按照點(diǎn)擊率排序) 協(xié)同過濾:推薦系統(tǒng)(淘寶購物車推薦) 自然語言處理:情感分析(對文本抓關(guān)鍵情感詞),實(shí)體識(shí)別(提取文本主要數(shù)據(jù),人名等) 深度學(xué)習(xí):圖像識(shí)別查看全部
-
5、互聯(lián)網(wǎng)廣告 CTR預(yù)估算法:點(diǎn)擊率的預(yù)估 6、推薦系統(tǒng)(類似于購物籃分析) 協(xié)同過濾算法,電商的推薦查看全部
-
3、垃圾郵件識(shí)別 樸素貝葉斯算法 4、信用卡欺詐 風(fēng)險(xiǎn)識(shí)別、欺詐識(shí)別。決策樹算法查看全部
-
2、用戶細(xì)分精確營銷 把用戶消費(fèi)的數(shù)據(jù)利用聚類算法,可以根據(jù)用戶信息,自動(dòng)對用戶進(jìn)行分類查看全部
-
關(guān)聯(lián)規(guī)則 -- 購買物品同時(shí)買了其他什么物品。 聯(lián)想連接 找出規(guī)律 紙尿布和啤酒的故事(數(shù)據(jù)挖掘)查看全部
-
歷史: 1、基于專家經(jīng)驗(yàn) 2、基于統(tǒng)計(jì)---分維度統(tǒng)計(jì)。數(shù)據(jù)分析,受限于數(shù)據(jù)分析人員的經(jīng)驗(yàn) 3、機(jī)器學(xué)習(xí): 模式①離線機(jī)器學(xué)習(xí),每天定時(shí)更新生成一個(gè)新的模型,但是如果出現(xiàn)異常狀況時(shí),在定時(shí)更新前就沒法給出正確的模型;②在線機(jī)器學(xué)習(xí),實(shí)時(shí)更新調(diào)整模型。查看全部
-
《概率論》《數(shù)據(jù)統(tǒng)計(jì)》是機(jī)器學(xué)習(xí)的基石查看全部
-
機(jī)器學(xué)習(xí)常見算法查看全部
-
6、看框架查看全部
舉報(bào)
0/150
提交
取消