簡介:數據診斷是數據挖掘和機器學習的第一步,然而卻被很多人忽略掉了。如果對數據本身不了解的話,容易受到嚴謹的業(yè)務人的挑戰(zhàn),同時,如果缺少了數據診斷的步驟,會增加后面數據預處理的難度,從而影響最終模型的效果。因此,本課程教授大家如何制作一個高效的,復用性高的,讓人更好地理解數據本身的數據診斷工具。
第2章 數據診斷整體介紹
數據獲取和數據讀取,統計指標的介紹與簡單示例
第3章 數據診斷工具制作
工具制作-依賴包的介紹,工具制作-缺失值和方差,工具制作-特殊描述值,工具制作-基本描述統計值,工具制作-功能整合