-
機器學習:行為數(shù)據(jù)(搜索歷史,點擊歷史,瀏覽歷史,評價),NOsql(分布式和CAP).對數(shù)據(jù)一致性要求不是很高; 數(shù)據(jù)分析:交易數(shù)據(jù)(話費賬單,用戶訂單,存取款賬單,和錢有關(guān))轉(zhuǎn)賬:事務(wù)保證(劃走金額,轉(zhuǎn)入金額),對數(shù)據(jù)一致性要求很高。查看全部
-
5、互聯(lián)網(wǎng)廣告 CTR預(yù)估算法(線性的邏輯回歸):點擊率的預(yù)估->百度搜索 6、推薦系統(tǒng)(類似于購物籃分析) 協(xié)同過濾算法,淘寶商品推薦查看全部
-
3、垃圾郵件識別 樸素貝葉斯算法 4、信用卡欺詐 風險識別、欺詐識別。決策樹算法查看全部
-
2、用戶細分精確營銷 把用戶消費的數(shù)據(jù)利用聚類算法,可以根據(jù)用戶信息,自動對用戶進行分類 兩字,分類。查看全部
-
購物籃分析:關(guān)聯(lián)規(guī)則 聯(lián)想連接 找出規(guī)律 紙尿布和啤酒的故事(數(shù)據(jù)挖掘) 經(jīng)濟學,捆綁銷售;更大的利益查看全部
-
歷史: 1、基于專家經(jīng)驗 (運維和產(chǎn)品頭腦風暴,程序員寫邏輯) 2、基于統(tǒng)計---分維度統(tǒng)計。數(shù)據(jù)分析,受限于數(shù)據(jù)分析人員的經(jīng)驗(數(shù)據(jù)報表,:聯(lián)機事務(wù)處理OLAPP(on-line transaction processing)) 3、機器學習: 模式①離線機器學習,每天定時更新,跑算法,生成一個新的模型,循環(huán),生成新的模型。對昨天數(shù)據(jù)的研究,用算法分析形成一個模型,指導明天的活動。缺點:存在偶然性,沒法給出正確的模型,如雙11的集中購物。 模式②在線機器學習,實時的數(shù)據(jù)進行分析,不斷的形成模型對用戶進行指導查看全部
-
expert(專家)的主觀性和片面性 從歷史數(shù)據(jù)中找出規(guī)律,把這些規(guī)律用到對未來自動作出決定。 用數(shù)據(jù)代替expert; 經(jīng)濟驅(qū)動,數(shù)據(jù)變現(xiàn); 大數(shù)據(jù):字面意思就是公司里的數(shù)據(jù)量變大了。查看全部
-
《概率論》《數(shù)據(jù)統(tǒng)計》是機器學習的基石 傳統(tǒng)的統(tǒng)計學,抽取一定量的樣本然后 進行概率統(tǒng)計,然后得到結(jié)論 之后進行假設(shè)檢驗 傳統(tǒng)的統(tǒng)計學受運算能力的限制,所以是用抽樣的方式; 而現(xiàn)在計算能力足夠強,就不需要采用抽樣的方式了。 做數(shù)據(jù)分析要對數(shù)據(jù)進行量化,才方便計算、比較。 傳統(tǒng)統(tǒng)計:抽樣-描述統(tǒng)計-結(jié)論-假設(shè)檢驗-推斷 機器學習不受計算量的限制,直接跳過抽樣 統(tǒng)計學受限于計算能力,依賴于采樣的方法,再反作用于原來的數(shù)據(jù)。步驟:抽樣-->描述統(tǒng)計-->結(jié)論-->假設(shè)檢驗。 現(xiàn)在無需考慮數(shù)據(jù)量的問題,無需抽樣技術(shù),直接全樣??衫每梢暬夹g(shù)來觀察數(shù)據(jù)。要進行數(shù)據(jù)分析,需要先進行量化,用模型擬合規(guī)律,函數(shù)-->函數(shù)曲線-->擬合。高維度時很難用可視化的方法,只能用數(shù)學運算。查看全部
-
5、互聯(lián)網(wǎng)廣告 CTR預(yù)估算法:點擊率的預(yù)估 6、推薦系統(tǒng)(類似于購物籃分析) 協(xié)同過濾算法,電商的推薦查看全部
-
關(guān)聯(lián)規(guī)則算法查看全部
-
common算法查看全部
-
高級一點查看全部
-
高級一點的算法查看全部
-
常見算法查看全部
-
常用算法查看全部
舉報
0/150
提交
取消