機(jī)器學(xué)習(xí) Day 8 | K-NN算法的簡(jiǎn)單實(shí)現(xiàn)（2）

標(biāo)簽：

機(jī)器學(xué)習(xí)

机器学习第七天逐步分析昨日的数字识别

KNN算法伪代码：

def classify0(inX, dataSet, labels, k):
    """
    距离度量 度量公式为欧氏距离
    inX            测试样本的图像文本转化的向量
    dataSet        <class 'numpy.ndarray'>   所有训练样本的m*1024的矩阵
    labels         存储0～9对应的index位置      len(labels)= m
    k              对查询点标签影响显著（效果拔群）。k值小的时候 近似误差小，估计误差大。 k值大 近似误差大，估计误差小。
    本例中取 k=3，11个错误
       若   k=2, 12个错误                  
            k=4, 11个错误
            k=5, 17个错误
    """
    # >>print(type(dataSet))
    #   <class 'numpy.ndarray'>
    # shape函数是numpy.core.fromnumeric中的函数，它的功能是读取矩阵的长度，比如shape[0]就是读取矩阵第一维度的长度。
    dataSetSize = dataSet.shape[0]    
    # 原型：numpy.tile(A,reps)
    # tile共有2个参数，A指待输入数组，reps则决定A重复的次数。整个函数用于重复数组A来构建新的数组。
    # 生成intX * dataSetSize的矩阵
    # 例： inX = [1,2,3]
    #     dataSetSize = 3      
    #   >>  print(tile(inX, (dataSetSize, 1)))
    #          [[3 3 3]
    #           [3 3 3]
    #           [3 3 3]]    
    diffMat = tile(inX, (dataSetSize, 1)) - dataSet    #欧式距离计算
    sqDiffMat = diffMat ** 2
    sqDistances = sqDiffMat.sum(axis=1)
    distances = sqDistances ** 0.5

    # argsort函数返回的是数组值从小到大的索引值,将距离排序：从小到大
    sortedDistIndicies = distances.argsort()    # 选取前K个最短距离， 选取这K个中最多的分类类别
    classCount = {}    for i in range(k):
        voteIlabel = labels[sortedDistIndicies[i]]
        classCount[voteIlabel] = classCount.get(voteIlabel, 0) + 1

    sortedClassCount = sorted(classCount.items(), key=operator.itemgetter(1), reverse=True)    return sortedClassCount[0][0]

def handwritingClassTest():
    # 1. 导入训练数据
    hwLabels = []
    trainingFileList = listdir(        '/Users/xiehao/Desktop/MachineLearning-master/input/2.KNN/trainingDigits/')  # load the training set
    # 训练集的数量   
    m = len(trainingFileList)    # 构造 ，m*1024的矩阵
    trainingMat = zeros((m, 1024))    # hwLabels存储0～9对应的index位置， trainingMat存放的每个位置对应的图片向量
    for i in range(m):        #例： 文件5_135.txt
        fileNameStr = trainingFileList[i]
        fileStr = fileNameStr.split('.')[0]  # take off .txt
        #例：classNumStr =5
        classNumStr = int(fileStr.split('_')[0])
        
        hwLabels.append(classNumStr)        # 将 32*32的矩阵->1*1024的矩阵
        # trainingMat填充1*1024矩阵
        trainingMat[i, :] = img2vector(            '/Users/xiehao/Desktop/MachineLearning-master/input/2.KNN/trainingDigits/%s' % fileNameStr)    # 2. 导入测试数据
    testFileList = listdir(        '/Users/xiehao/Desktop/MachineLearning-master/input/2.KNN/testDigits/')  # iterate through the test set
    errorCount = 0.0
    # 测试样本数量
    mTest = len(testFileList)    for i in range(mTest):
        fileNameStr = testFileList[i]
        fileStr = fileNameStr.split('.')[0]  # take off .txt
        classNumStr = int(fileStr.split('_')[0])        # 将测试样本的32*32的矩阵-->1*1024的矩阵
        vectorUnderTest = img2vector(            '/Users/xiehao/Desktop/MachineLearning-master/input/2.KNN/testDigits/%s' % fileNameStr)        #执行上面定义的算法
        classifierResult = classify0(vectorUnderTest, trainingMat, hwLabels, 3)
        print("the classifier came back with: %d, the real answer is: %d" % (classifierResult, classNumStr))        if (classifierResult != classNumStr): errorCount += 1.0
    print("\nthe total number of errors is: %d" % errorCount)
    print("\nthe total error rate is: %f" % (errorCount / float(mTest)))

作者：raphah
链接：https://www.jianshu.com/p/3af7bcb2d0dd

點(diǎn)擊查看更多內(nèi)容

為 TA 點(diǎn)贊

若覺得本文不錯(cuò)，就分享一下吧！

評(píng)論

評(píng)論

共同學(xué)習(xí)，寫下你的評(píng)論

評(píng)論加載中...

展開查看更多評(píng)論

作者其他優(yōu)質(zhì)文章

正在加載中

慕村9548890

手記
篇

粉絲

227

獲贊與收藏

994

關(guān)注作者，訂閱最新文章

閱讀免費(fèi)教程

后端通用面試教程

41個(gè)小節(jié) 32253 360

網(wǎng)絡(luò)編程入門教程

20個(gè)小節(jié) 13299 250

Pandas 入門教程

25個(gè)小節(jié) 19918 373

推薦

評(píng)論

收藏

共同學(xué)習(xí)，寫下你的評(píng)論



感謝您的支持，我會(huì)繼續(xù)努力的～

掃碼打賞，你說多少就多少

贊賞金額會(huì)直接到老師賬戶

支付方式

打開微信掃一掃，即可進(jìn)行掃碼打賞哦

今天注冊(cè)有機(jī)會(huì)得

100積分直接送

付費(fèi)專欄免費(fèi)學(xué)

大額優(yōu)惠券免費(fèi)領(lǐng)

立即參與放棄機(jī)會(huì)

點(diǎn)擊
抽獎(jiǎng)

慕課手記新用戶專享福利

恭喜你，你的運(yùn)氣太好了，居然抽中了 100個(gè)積分！

恭喜你，抽中了價(jià)值元的專欄！

太棒了，直接落到你賬戶里！

積分商城里的羅技鼠標(biāo)、機(jī)械鍵盤、
Kindle 閱讀器、小米平衡車
Apple iPad （10.2英寸）、大額優(yōu)惠券
在等著你去兌換了噢

作者：

免費(fèi)贈(zèng)送

兌換碼：1111222211 復(fù)制

優(yōu)惠券可用于購(gòu)買實(shí)戰(zhàn)課、體系課
無門檻使用

先去看看，有什么好東西馬上兌換我愛學(xué)習(xí)，選課去


第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

機(jī)器學(xué)習(xí) Day 8 | K-NN算法的簡(jiǎn)單實(shí)現(xiàn)（2）

閱讀免費(fèi)教程