簡介:本課介紹數(shù)據(jù)預(yù)處理過程體系,包括數(shù)據(jù)類型與采集、文本轉(zhuǎn)化與抽取、數(shù)據(jù)集成與規(guī)約、中文分詞、數(shù)據(jù)清洗、特征提取與變換、特征向量化、特征降維、特征選擇、可視化、詞典模型、TF-IDF向量模型、主題模型等。
第1章 主成分分析PCA實(shí)現(xiàn)特征降維
- 視頻: 1-1 數(shù)據(jù)降維與PCA介紹 (06:47)
- 視頻: 1-2 加載二維坐標(biāo)系數(shù)據(jù) (05:44)
- 視頻: 1-3 PCA算法實(shí)現(xiàn)(1) (08:15)
- 視頻: 1-4 PCA算法實(shí)現(xiàn)(2) (13:05)
- 視頻: 1-5 PCA降維數(shù)據(jù)可視化 (07:39)
- 視頻: 1-6 處理缺失值的新聞數(shù)據(jù) (11:25)
- 視頻: 1-7 特征數(shù)據(jù)主成分分析(1) (07:10)
- 視頻: 1-8 特征數(shù)據(jù)主成分分析(2) (07:56)
- 視頻: 1-9 PCA技術(shù)實(shí)現(xiàn)新聞文本特征降維 (14:54)