-
混淆矩陣,用于衡量分類算法的準(zhǔn)確程度
True Positives(TP):預(yù)測準(zhǔn)確、實(shí)際為正樣本的數(shù)量(實(shí)際為1,預(yù)測為1)
True Negatives(TN):預(yù)測準(zhǔn)確,實(shí)際為負(fù)樣本的數(shù)量(實(shí)際為0,預(yù)測為0)
False Positive(FP):預(yù)測錯誤、實(shí)際為負(fù)樣本的數(shù)量(實(shí)際為0,預(yù)測為1)
FalseNegatives(FN):預(yù)測錯誤、實(shí)際為正樣本的數(shù)量(實(shí)際為1,預(yù)測為0)
查看全部 -
邏輯回歸模型:計(jì)算數(shù)據(jù)歸屬于某一類別的概率P,根據(jù)概率數(shù)值判斷其類別。主要應(yīng)用于二分類問題
查看全部 -
邏輯回歸模型:在二分類問題中使用更加廣泛
使用準(zhǔn)確率進(jìn)行模型評估的局限性
混淆矩陣、模型衡量指標(biāo)及其意義
查看全部 -
將整個數(shù)據(jù)集用于訓(xùn)練與測試,訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)相同導(dǎo)致的問題:
1)訓(xùn)練模型的最終目標(biāo)是為了預(yù)測新數(shù)據(jù)對應(yīng)的結(jié)果
2)最大化訓(xùn)練準(zhǔn)確率通常會導(dǎo)致模型復(fù)雜化
3)過度復(fù)雜模型容易導(dǎo)致訓(xùn)練數(shù)據(jù)的過度擬合
查看全部 -
# 模型評估 比較不同K值 模型的好壞
# 全數(shù)據(jù)集訓(xùn)練與預(yù)測
# 訓(xùn)練數(shù)據(jù)集、測試數(shù)據(jù)集分離
# 如何選擇模型合適的參數(shù),預(yù)測新數(shù)據(jù)對應(yīng)結(jié)果
查看全部 -
使用scikit-learn建模四步驟
調(diào)用需要使用的模型類
模型初始化,創(chuàng)建一個模型實(shí)例
模型訓(xùn)練
模型預(yù)測
查看全部 -
給定一個訓(xùn)練數(shù)據(jù)集,對新的輸入實(shí)例,在訓(xùn)練數(shù)據(jù)集中找到與該實(shí)例最鄰近的K個實(shí)例,這K個實(shí)例的多數(shù)屬于某個類,就把該輸入實(shí)例分類到這個類中。
查看全部 -
分類: 根據(jù)數(shù)據(jù)集目標(biāo)的特征或者屬性,劃分到已有類別中
常用的分類算法:K近鄰(KNN),邏輯回歸、決策樹、樸素貝葉斯
查看全部 -
數(shù)據(jù)預(yù)處理:
iris數(shù)據(jù)加載
數(shù)據(jù)展示
確認(rèn)數(shù)據(jù)維度
使用scikit-learn進(jìn)行數(shù)據(jù)處理的四個關(guān)鍵點(diǎn)
1區(qū)分開屬性數(shù)據(jù)與結(jié)果數(shù)據(jù)
2屬性數(shù)據(jù)與結(jié)果數(shù)據(jù)都是量化的
3運(yùn)算過程中,屬性數(shù)據(jù)與結(jié)果數(shù)據(jù)的類型都是Numpy數(shù)組
4屬性數(shù)據(jù)與結(jié)果數(shù)據(jù)的維度是對應(yīng)的
查看全部 -
界面設(shè)置
jt -t oceans16 -f fira -fs 17 -cellw 90% -ofs 14 -dfs 14 -T
查看全部 -
Jupyter notebook
是一個開源的Web應(yīng)用程序,旨在方便開發(fā)者創(chuàng)建和共享代碼文檔,用戶可以在里面寫代碼、運(yùn)行代碼、查看結(jié)果,并在其中可視化數(shù)據(jù)。
基于Web框架進(jìn)行交互開發(fā),非常方便。
查看全部 -
Scikit-learn的特點(diǎn)是繼承了機(jī)器學(xué)習(xí)中各類成熟的算法,容易安裝和使用,樣例豐富、教程和文檔也非常詳細(xì)。
但sklearn不支持python之外的語言,不支持深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。
查看全部 -
Scikit-learn工具包
Python中針對機(jī)器學(xué)習(xí)應(yīng)用而發(fā)展起來的一款開源框架。可以實(shí)現(xiàn)數(shù)據(jù)預(yù)處理、分類、回歸、降維、模型選擇等常用的機(jī)器學(xué)習(xí)算法。
查看全部 -
Python的使用場景:Web、Mobile、Enterprise、Embedded
Python的優(yōu)點(diǎn):簡單、開發(fā)效率高、高級語言、可移植性、可擴(kuò)展性、可嵌入性。
缺點(diǎn):速度慢、代碼不能加密
查看全部 -
解釋性:不需要變異成二進(jìn)制代碼,可以直接從源代碼運(yùn)行
面向?qū)ο螅篜ython既支持面向過程的編程也支持面向?qū)ο?/p>
可移植性:開源本質(zhì),可以在不同平臺進(jìn)行開發(fā)
高層語言:無須考慮諸如如何管理程序使用的內(nèi)存一類的底層細(xì)節(jié)
查看全部
舉報(bào)