亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

PYthon iris KNN,SVM,NB 數據分析 + 可視化

系統 2333 0

這學期選修了一門Python在大數據中的應用這門課,是方老師教的,了解了一些數據分析常用的庫,Numpy,plt,sklearn等

印象比較深的庫有
1.plt 可以對數據進行可視化,利于直觀的進行數據分析
2.sklearn 有許多機器學習算法,可以直接用,十分方便

老師留了幾道python題,我這次直接拿來做總結

//題目描述:
用scikit-learn加載iris數據集,采用KNN、SVM和樸素貝葉斯算法進行分類,最后比較這三種方法的優缺點。

代碼:

            
              
                # -*- coding: utf-8 -*-
              
              
                """
Created on Sat Jun  1 18:24:09 2019

@author: Administrator
"""
              
              
                # =============================================================================
              
              
                # 作業要求
              
              
                # 用scikit-learn加載iris數據集,
              
              
                # 采用KNN、SVM和樸素貝葉斯算法進行分類,最后比較這三種方法的優缺點。
              
              
                # =============================================================================
              
              
                # =============================================================================
              
              
                # #Iris也稱鳶尾花卉數據集,是一類多重變量分析的數據集。
              
              
                # #可通過花萼長度,花萼寬度,花瓣長度,花瓣寬度4個屬性
              
              
                # #預測鳶尾花卉屬于(Setosa,Versicolour,Virginica)三個種類中的哪一類。
              
              
                # =============================================================================
              
              
                #導入必要的包
              
              
                import
              
               numpy 
              
                as
              
               np

              
                import
              
               pylab 
              
                as
              
               plt

              
                from
              
               sklearn
              
                .
              
              datasets 
              
                import
              
               load_iris 

              
                from
              
               sklearn
              
                .
              
              model_selection 
              
                import
              
               train_test_split 
              
                #引入train_test_split函數
              
              
                from
              
               sklearn
              
                .
              
              neighbors 
              
                import
              
               KNeighborsClassifier   
              
                #引入KNN分類器
              
              
                from
              
               sklearn
              
                .
              
              svm 
              
                import
              
               SVC
              
                #引入SVM分類器
              
              
                from
              
               sklearn
              
                .
              
              naive_bayes 
              
                import
              
               GaussianNB
              
                #使用高斯貝葉斯模型
              
              

iris
              
                =
              
              load_iris
              
                (
              
              
                )
              
              
                #加載iris信息
              
              
data
              
                =
              
              iris
              
                .
              
              data
              
                #iris的數據集
              
              
target
              
                =
              
              iris
              
                .
              
              target
              
                #iris的種類
              
              
                #使用train_test_split()函數將數據集分成用于訓練的data和用于測試的data
              
              
data_train
              
                ,
              
              data_test
              
                ,
              
              target_train
              
                ,
              
              target_test
              
                =
              
              train_test_split
              
                (
              
              data
              
                ,
              
              target
              
                ,
              
              test_size
              
                =
              
              
                0.3
              
              
                ,
              
              random_state
              
                =
              
              
                0
              
              
                )
              
              
                #1.kNN算法分類
              
              
knn
              
                =
              
              KNeighborsClassifier
              
                (
              
              
                )
              
              
                #調用knn分類器
              
              
knn
              
                .
              
              fit
              
                (
              
              data_train
              
                ,
              
              target_train
              
                )
              
              
                #訓練knn分類器
              
              
accurate_Knn
              
                =
              
              knn
              
                .
              
              score
              
                (
              
              data_test
              
                ,
              
              target_test
              
                ,
              
              sample_weight
              
                =
              
              
                None
              
              
                )
              
              
                #調用該對象的打分方法,計算出準確率
              
              
                print
              
              
                'KNN預測值:'
              
              
                ,
              
              
                (
              
              knn
              
                .
              
              predict
              
                (
              
              data_test
              
                )
              
              
                )
              
              
                #預測值
              
              
                print
              
              
                '真實值:'
              
              
                ,
              
              
                (
              
              target_test
              
                )
              
              
                #真實值
              
              
                print
              
              
                'KNN輸出訓練集的準確率為:'
              
              
                ,
              
              accurate_Knn

              
                for
              
               i 
              
                in
              
              
                range
              
              
                (
              
              
                len
              
              
                (
              
              target_test
              
                )
              
              
                )
              
              
                :
              
              
                #因為數據是二維數組,所以要用for循環,也可以用reshape對二位數組進行變形
              
              
                if
              
               target_test
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                0
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'r'
              
              
                )
              
              
                #畫散點圖
              
              
                elif
              
               target_test
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                1
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'g'
              
              
                )
              
              
                else
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'b'
              
              
                )
              
              
plt
              
                .
              
              title
              
                (
              
              
                "iris"
              
              
                )
              
              
plt
              
                .
              
              xlabel
              
                (
              
              
                "ewidth"
              
              
                )
              
              
plt
              
                .
              
              ylabel
              
                (
              
              
                "elength"
              
              
                )
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
              

pr
              
                =
              
              knn
              
                .
              
              predict
              
                (
              
              data_test
              
                )
              
              
                for
              
               i 
              
                in
              
              
                range
              
              
                (
              
              
                len
              
              
                (
              
              pr
              
                )
              
              
                )
              
              
                :
              
              
                if
              
               pr
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                0
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'r'
              
              
                )
              
              
                elif
              
               pr
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                1
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'g'
              
              
                )
              
              
                else
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'b'
              
              
                )
              
              
plt
              
                .
              
              title
              
                (
              
              
                "iris-KNN"
              
              
                )
              
              
plt
              
                .
              
              xlabel
              
                (
              
              
                "ewidth"
              
              
                )
              
              
plt
              
                .
              
              ylabel
              
                (
              
              
                "elength"
              
              
                )
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
              
                print
              
              
                (
              
              
                "\n\n"
              
              
                )
              
              
                #2.SVM算法分類
              
              
svm
              
                =
              
              SVC
              
                (
              
              kernel
              
                =
              
              
                'rbf'
              
              
                ,
              
              gamma
              
                =
              
              
                0.1
              
              
                ,
              
              decision_function_shape
              
                =
              
              
                'ovo'
              
              
                ,
              
              C
              
                =
              
              
                0.8
              
              
                )
              
              
                #搭建模型,訓練SVM分類器
              
              
svm
              
                .
              
              fit
              
                (
              
              data_train
              
                ,
              
              target_train
              
                )
              
              
                #訓練SVC
              
              
accurate_Svm
              
                =
              
              svm
              
                .
              
              score
              
                (
              
              data_train
              
                ,
              
              target_train
              
                )
              
              
                print
              
              
                'SVM預測值:'
              
              
                ,
              
              
                (
              
              svm
              
                .
              
              predict
              
                (
              
              data_test
              
                )
              
              
                )
              
              
                #預測值
              
              
                print
              
              
                '真實值:'
              
              
                ,
              
              
                (
              
              target_test
              
                )
              
              
                #真實值
              
              
                print
              
              
                'SVM-輸出訓練集的準確率為:'
              
              
                ,
              
              accurate_Svm

              
                for
              
               i 
              
                in
              
              
                range
              
              
                (
              
              
                len
              
              
                (
              
              target_test
              
                )
              
              
                )
              
              
                :
              
              
                if
              
               target_test
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                0
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'r'
              
              
                )
              
              
                elif
              
               target_test
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                1
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'g'
              
              
                )
              
              
                else
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'b'
              
              
                )
              
              
plt
              
                .
              
              title
              
                (
              
              
                "iris"
              
              
                )
              
              
plt
              
                .
              
              xlabel
              
                (
              
              
                "ewidth"
              
              
                )
              
              
plt
              
                .
              
              ylabel
              
                (
              
              
                "elength"
              
              
                )
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
              

pr
              
                =
              
              svm
              
                .
              
              predict
              
                (
              
              data_test
              
                )
              
              
                for
              
               i 
              
                in
              
              
                range
              
              
                (
              
              
                len
              
              
                (
              
              pr
              
                )
              
              
                )
              
              
                :
              
              
                if
              
               pr
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                0
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'r'
              
              
                )
              
              
                elif
              
               pr
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                1
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'g'
              
              
                )
              
              
                else
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'b'
              
              
                )
              
              
plt
              
                .
              
              title
              
                (
              
              
                "iris-SVM"
              
              
                )
              
              
plt
              
                .
              
              xlabel
              
                (
              
              
                "ewidth"
              
              
                )
              
              
plt
              
                .
              
              ylabel
              
                (
              
              
                "elength"
              
              
                )
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
              
                print
              
              
                (
              
              
                "\n\n"
              
              
                )
              
              
                #3.樸素貝葉斯算法分類
              
              
nb
              
                =
              
              GaussianNB
              
                (
              
              
                )
              
              
                #設置分類器
              
              
nb
              
                .
              
              fit
              
                (
              
              data_train
              
                ,
              
              target_train
              
                )
              
              
accurate_Nb
              
                =
              
              nb
              
                .
              
              score
              
                (
              
              data_train
              
                ,
              
              target_train
              
                )
              
              
                print
              
              
                'NB預測值:'
              
              
                ,
              
              
                (
              
              nb
              
                .
              
              predict
              
                (
              
              data_test
              
                )
              
              
                )
              
              
                #預測值
              
              
                print
              
              
                '真實值:'
              
              
                ,
              
              
                (
              
              target_test
              
                )
              
              
                #真實值
              
              
                print
              
              
                'NB-輸出訓練集的準確率為:'
              
              
                ,
              
              accurate_Nb

              
                for
              
               i 
              
                in
              
              
                range
              
              
                (
              
              
                len
              
              
                (
              
              target_test
              
                )
              
              
                )
              
              
                :
              
              
                if
              
               target_test
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                0
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'r'
              
              
                )
              
              
                elif
              
               target_test
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                1
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'g'
              
              
                )
              
              
                else
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'b'
              
              
                )
              
              
plt
              
                .
              
              title
              
                (
              
              
                "iris"
              
              
                )
              
              
plt
              
                .
              
              xlabel
              
                (
              
              
                "ewidth"
              
              
                )
              
              
plt
              
                .
              
              ylabel
              
                (
              
              
                "elength"
              
              
                )
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
              

pr
              
                =
              
              nb
              
                .
              
              predict
              
                (
              
              data_test
              
                )
              
              
                for
              
               i 
              
                in
              
              
                range
              
              
                (
              
              
                len
              
              
                (
              
              pr
              
                )
              
              
                )
              
              
                :
              
              
                if
              
               pr
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                0
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'r'
              
              
                )
              
              
                elif
              
               pr
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                1
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'g'
              
              
                )
              
              
                else
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'b'
              
              
                )
              
              

plt
              
                .
              
              title
              
                (
              
              
                "iris-NB"
              
              
                )
              
              
plt
              
                .
              
              xlabel
              
                (
              
              
                "ewidth"
              
              
                )
              
              
plt
              
                .
              
              ylabel
              
                (
              
              
                "elength"
              
              
                )
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
            
          

運行結果
PYthon iris KNN,SVM,NB 數據分析 + 可視化_第1張圖片

偷個懶,其他的運行結果就不貼了,都差不多。

結果分析:
對比三種算法的準確率我發現knn=0.97,svm=0.96,樸素貝葉斯=0.94
即在較少數據時knn>svm>樸素貝葉斯,進一步得出結論,較少數據時KNN和svm的分類效率較高,樸素貝葉斯的效率較低。

本人水平有限,如有問題歡迎大家不吝指正。


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 免费看又爽又黄禁片视频1000 | 美国一级毛片片aa久久综合 | 国产精品久久久久鬼色 | 日本最黄视频 | 日韩一区二区超清视频 | 国产精品分类视频分类一区 | 亚洲成人免费视频在线 | 亚洲一在线 | 国产第一页久久亚洲欧美国产 | 韩国精品一区 | 国产一级黄色毛片 | 日韩毛片 | 久青草视频97国内免费影视 | 久久精品国产一区二区小说 | 色接久久| 国产精品日本一区二区在线播放 | 精品国产成人系列 | 性生大片一级毛片免费观看 | avtt亚洲一区中文字幕 | 亚洲看片 | 一本大道香蕉中文在线高清 | 一区二区三区高清不卡 | 色姑娘色综合 | 成人欧美一区二区三区黑人3p | 亚洲精品伊人 | 久久免费视频一区 | 91九色蝌蚪 | 国产高清a毛片在线看 | 真实国产乱人伦在线视频播放 | 中文国产成人精品久久水 | 欧美成人亚洲高清在线观看 | 日本不卡一区二区三区视频 | 日本香蕉视频在线观看 | 亚洲欧美一区二区三区综合 | 爆操大奶美女 | 亚洲欧美另类在线视频 | 国产精品嫩草影院奶水 | 欧美国产精品不卡在线观看 | 国产精品免费aⅴ片在线观看 | 久久免费在线 | 五月婷久久 |