-
課程小結(jié)查看全部
-
Demo-胺片按色彩聚類 k-means聚類查看全部
-
機(jī)器學(xué)習(xí)常見算法(2)著名算法 1.FP-Growth---關(guān)聯(lián)分析方法Apriori的改進(jìn)。 2.邏輯回歸---應(yīng)用非常多,多用于百度、Google搜索結(jié)果的排序。 3.RF(隨機(jī)森林)、GBDT---和AdaBoost類似,都屬于決策樹算法。 4.推薦算法---電商標(biāo)配 5.LDA---用于文本分析、自然語言處理。有一定的難度。 6.Word2Vector---google出品,耳熟能詳,用于文本挖掘。 7.HMM(隱馬爾科夫)、CRF(條件分析)---文本挖掘。 8.深度學(xué)習(xí)---目前最火的算法查看全部
-
機(jī)器學(xué)習(xí)常見算法(1)ICDM 1.分類---C4.5使用決策樹算法,可以解決【分類】&【回歸】問題; 2.聚類---K-Means算法,屬于無監(jiān)督方法,解決電信用戶分類問題; 3.統(tǒng)計學(xué)習(xí)---SVM(支持向量機(jī))可以解決分類(主)和回歸問題,有很好的表現(xiàn)和深厚的數(shù)學(xué)理論支撐,曾經(jīng)被認(rèn)為是最好的分類算法?,F(xiàn)在光芒被【深度學(xué)習(xí)】掩蓋了。有一定的數(shù)學(xué)門檻,面試中經(jīng)常被問。 4.關(guān)聯(lián)分析---Apriori應(yīng)用于“尿片和紙尿褲”案例,最早解決了頻繁項(xiàng)集問題。由于需要頻繁訪問數(shù)據(jù)庫,已被淘汰。取代它的是華人開的【FP-Growth】算法。應(yīng)用:電商的推薦系統(tǒng),但目前有更好的替代方法。 5.統(tǒng)計分析---EM算法是一個算法框架,用于解決一系列問題。 6.連接挖掘---PageRank。Google使用的網(wǎng)頁排序算法,很著名。 7.集裝與推進(jìn)---AdaBoosts算法,應(yīng)用于人臉識別,本質(zhì)為改進(jìn)的決策樹算法,屬于有監(jiān)督的分類算法。 8.分類---kNN。相對簡單的分類算法,有監(jiān)督。 9.分類---Naive Bayes樸素貝葉斯算法,用于識別垃圾郵件。 目前不常用的算法:Apriori和CART。查看全部
-
機(jī)器學(xué)習(xí)算法分類(3)——按算法的本質(zhì)【重要!!】 生成模型---給出屬于A/B/C類的概率,類似陪審團(tuán); 判別模型---通過給定函數(shù)判斷Y/N,類似大法官裁決;查看全部
-
機(jī)器學(xué)習(xí)算法分類(2)——按要解決的問題 分類與回歸 聚類 標(biāo)注---打標(biāo)簽查看全部
-
機(jī)器學(xué)習(xí)算法分類(1)——按數(shù)據(jù)情況:Y有沒有確定 有監(jiān)督學(xué)習(xí)---已知分類(標(biāo)簽)---分類,回歸 無監(jiān)督學(xué)習(xí)---未知分類(無標(biāo)簽)---聚類 半監(jiān)督學(xué)習(xí)---強(qiáng)化學(xué)習(xí),隨著樣本數(shù)據(jù)量上升,分類標(biāo)準(zhǔn)清晰查看全部
-
機(jī)器學(xué)習(xí)和數(shù)據(jù)分析的區(qū)別 - 目標(biāo)用戶不同 1.數(shù)據(jù)分析 - 公司高層。主要目標(biāo)是供領(lǐng)導(dǎo)層決策。 2.機(jī)器學(xué)習(xí) - 用戶個體查看全部
-
機(jī)器學(xué)習(xí)和數(shù)據(jù)分析的區(qū)別 - 參與者不同 1.數(shù)據(jù)分析 - 公司的數(shù)據(jù)分析師。分析師能力決定結(jié)果。 2.機(jī)器學(xué)習(xí) - 數(shù)據(jù) + 算法查看全部
-
機(jī)器學(xué)習(xí)和數(shù)據(jù)分析的區(qū)別 - 技術(shù)手段不同 數(shù)據(jù)分析(OLAP,聯(lián)機(jī)分析)-用戶(數(shù)據(jù)分析師)驅(qū)動,交互式分析。 機(jī)器學(xué)習(xí)-數(shù)據(jù)+算法驅(qū)動,自動進(jìn)行識別。查看全部
-
機(jī)器學(xué)習(xí)和數(shù)據(jù)分析的區(qū)別 - 解決的問題不同 數(shù)據(jù)分析 - 側(cè)重歷史的總結(jié); 機(jī)器學(xué)習(xí) - 側(cè)重未來的預(yù)測;查看全部
-
機(jī)器學(xué)習(xí)和數(shù)據(jù)分析的區(qū)別 數(shù)據(jù)分析:交易數(shù)據(jù)、少量數(shù)據(jù)、采樣分析。對數(shù)據(jù)一致性要求嚴(yán)格,使用關(guān)系型數(shù)據(jù)庫sql serve、mysql、oracle。 機(jī)器學(xué)習(xí):行為數(shù)據(jù)、海量數(shù)據(jù)、全量分析。需要保證數(shù)據(jù)吞吐量,數(shù)據(jù)一致性可以打折扣,所以用NoSQL數(shù)據(jù)庫(MongoDB、nosql)和分布式數(shù)據(jù)分析平臺(Hadoop、Spark)。查看全部
-
NoSQL數(shù)據(jù)庫只能用來處理【行為數(shù)據(jù)】,在保證吞吐量的前提下,會對數(shù)據(jù)的一致性打一定的折扣。查看全部
-
機(jī)器學(xué)習(xí)使用 - 行為數(shù)據(jù)(互聯(lián)網(wǎng)公司)查看全部
-
數(shù)據(jù)分析使用 交易數(shù)據(jù)查看全部
舉報
0/150
提交
取消