亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

機器學(xué)習(xí)-AdaBoosting及其Java實現(xiàn)

系統(tǒng) 2028 0

??? Adaboost with trees is the best off-the-shelf classifier in the world. ?? -Breiman 1996

??? 決策樹算法起源于1984年Breiman,Friedman等人提出的CART,后來又有人(Quinlan等)提出ID3,C4.5,C5.0,CHAID等算法,但是90年代隨著支持向量機(SVM)的提出和發(fā)展,決策樹遇到了極大的挑戰(zhàn)。1996年,F(xiàn)reund和Schapire等人提出了Adaboost算法,可以將多個弱分類器(比如Stump決策樹)組合起來形成一個更加強大的強分類器,其性能可以與支持向量機媲美,所以才會有Breiman上面那句話。

? (一) 算法:

? Adaboost算法的思想起源于80年代Valiant提出的PAC理論(Valiant因此獲得2010年圖靈獎),1996年由Freund和Schapire提出該算法(二人因此獲得2003年的 Godel Price ,是計算機理論界的最高獎),其大體思想是,訓(xùn)練多個 弱分類器 (Weak Classifier,所謂弱分類器是指分類效果僅比隨機分類器效果好就可以,亦即分類錯誤率要小于0.5,典型的弱分類器如 Stump ,亦即只有一個決策節(jié)點的決策樹),每個弱分類器都會更加關(guān)注上個弱分類器分錯類的訓(xùn)練樣例,最終的分類器由所有的這些弱分類器加權(quán)組成,亦即其分類結(jié)果為多個弱分類器的分類結(jié)果的加權(quán)和。下面是詳細介紹:

? Adaboost算法會訓(xùn)練M個弱分類器,每個分類器都會給所有的訓(xùn)練樣例賦予權(quán)重,第一個分類器所有訓(xùn)練樣例的權(quán)重都是1/N(N為訓(xùn)練樣例的個數(shù)),后面每個弱分類器都會提高前面的弱分類器分錯類的訓(xùn)練樣例的權(quán)重,以便使得這些訓(xùn)練樣例盡量不會再分錯。在此,我們僅討論最簡單的二分類,亦即分類結(jié)果為{+1,-1}:

?

? 1. 為第一個弱分類器的所有訓(xùn)練樣例初始化權(quán)重,都設(shè)為1/N。

機器學(xué)習(xí)-AdaBoosting及其Java實現(xiàn)_第1張圖片

? 2. 迭代M次,亦即訓(xùn)練M個弱分類器:

? (a) 訓(xùn)練當(dāng)前弱分類器,使得訓(xùn)練樣例的加權(quán)誤差Jm最小。

? (b) 求得當(dāng)前弱分類器的加權(quán)誤差率ε,如果ε>0.5,則當(dāng)前分類器效果太差,算法終止,否則計算α=ln((1-ε)/ε),α是一個大于1的數(shù),用來增加被分錯類的訓(xùn)練樣例的權(quán)重。

? (c) 對于所有被當(dāng)前弱分類器分錯類的訓(xùn)練樣例,增大其權(quán)重(乘以α),以便在訓(xùn)練下一個弱分類器時重視這些被分錯類的訓(xùn)練樣例(真正實現(xiàn)時還應(yīng)進行標(biāo)準(zhǔn)化,亦即使得所有權(quán)重的和為1)。

機器學(xué)習(xí)-AdaBoosting及其Java實現(xiàn)_第2張圖片

? 3. 最終得到的強分類器利用M個弱分類器的分類結(jié)果的加權(quán)和作為測試訓(xùn)練樣例的分類結(jié)果。

? (二)Java實現(xiàn)

? 為了充分理解Adaboost算法,我寫了一個簡單的Java程序,訓(xùn)練樣例是二維空間上的N個點,用到的弱分類器是最簡單的Stump,亦即樹樁。當(dāng)訓(xùn)練數(shù)據(jù)是隨機生成的時候,迭代10次后得到的分類器的準(zhǔn)確率會達到75%-90%。當(dāng)訓(xùn)練數(shù)據(jù)是形如下所示的分布時(但是我的數(shù)據(jù)集只有20個點),準(zhǔn)確率可以達到100%。

機器學(xué)習(xí)-AdaBoosting及其Java實現(xiàn)_第3張圖片

? 參考文獻:

? [1] Christopher M.Bishop Pattern Recognization and Machine Learnin ( PRML ), Chapter 14 Combining Models, p657

? [2] Ethern Alpaydin 機器學(xué)習(xí)導(dǎo)論 15章 組合多學(xué)習(xí)器 p236

? [3] Boosting算法簡介 百度搜索研發(fā)部 官方博客

? [4] 統(tǒng)計學(xué)習(xí)那些事 數(shù)據(jù)挖掘研究院

? [5] Wiki:Decision Tree Learning

? [6] Wiki:AdaBoost

機器學(xué)習(xí)-AdaBoosting及其Java實現(xiàn)


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 国产亚洲精品福利 | 狠狠色先锋资源网 | 中文字幕在线精品不卡 | 高清视频一区二区 | 国产成人h综合亚洲欧美在线 | 免费一区 | 国内精品久久久久久不卡影院 | 伊人国产视频 | 国产精品人伦久久 | 日日爽夜夜爽 | 久久亚洲国产午夜精品理论片 | 亚洲香蕉久久一区二区三区四区 | 高清亚洲综合色成在线播放放 | 亚洲视频免费一区 | 日韩毛片欧美一级国产毛片 | 亚洲国产高清视频在线观看 | 亚洲午夜久久久精品影院视色 | 在线观看国产一区二区三区 | 精品乱人伦一区二区 | 日韩精品一区二区在线观看 | 九九热免费在线视频 | 日本高清在线一区二区三区 | 久久99精品久久久久久野外 | 精品99久久 | 国产精品91av | 欧美久久综合九色综合 | 天天天天天天干 | 欧美洲久久日韩欧美 | 国产91一区二这在线播放 | 男人免费网站 | 在线免费一区二区 | 一级毛片私人影院老司机 | 日日日日人人人夜夜夜2017 | 豆国产97在线 | 亚洲 | 亚洲视屏在线观看 | 国内精品七七久久影院 | 欧美一级永久免费毛片在线 | 全部在线播放免费毛片 | 四虎成年永久免费网站 | 中文字幕色婷婷在线视频 | 亚洲成人在线免费观看 |