在本篇文章中,我們主要介紹掃描分發(fā)的內(nèi)容,自我感覺有個(gè)不錯(cuò)的建議和大家分享下
????
Apriori核心算法程過如下:
????
- 掃描數(shù)據(jù)集合盤算出各個(gè)1項(xiàng)集的持支度,得 到頻仍1項(xiàng)集的集合。
- 接連,由2個(gè)只有一個(gè)項(xiàng)不同的屬于的頻集做一 個(gè)(k-2)JOIN運(yùn)算到得的。
- 剪枝,由于是的超集,所以可能有些元素不是頻仍的。在 潛伏k項(xiàng)集的某個(gè)集子不是中的成員是,則該潛伏頻仍項(xiàng)集不是能可頻仍的可以從中移去。
- 通過 單趟掃描數(shù)據(jù)集合,盤算中各個(gè)項(xiàng)集的持支度,將中不滿足持支度的項(xiàng)集去掉構(gòu)成。
????
?
????
通過迭代循環(huán),重復(fù)步調(diào)2~4,直到有某個(gè)r值使得為空,這時(shí)算法止停。在剪枝步中的個(gè)每元 素需在易交數(shù)據(jù)庫中進(jìn)行驗(yàn)證來定決其是不是參加,這里的驗(yàn)證程過 是算法性能的一個(gè)瓶頸。這個(gè)法方要求多次掃描可能很大的易交數(shù)據(jù)庫。可能生產(chǎn)大批的候選集,以及可能要需重復(fù)掃描數(shù)據(jù)庫,是Apriori算法的兩大缺 點(diǎn)。
????
現(xiàn)在,幾乎有所高效的發(fā)明關(guān)聯(lián)規(guī)則的并行數(shù)據(jù)挖掘算法都是基于Apriori算法 的,Agrawal和Shafer 提出了三種并行算法:數(shù)計(jì)發(fā)分(Count Distribution)算法、數(shù)據(jù)發(fā)分(Data Distribution)算法和候選發(fā)分(Candidate Distribute)算法。
文章結(jié)束給大家分享下程序員的一些笑話語錄: 自行車
一個(gè)程序員騎著一個(gè)很漂亮的自行車到了公司,另一個(gè)程序員看到了他,問 到,“你是從哪搞到的這么漂亮的車的?”
騎車的那個(gè)程序員說, “我剛從那邊過來, 有一個(gè)漂亮的姑娘騎著這個(gè)車過來, 并停在我跟前,把衣服全脫了,然后對我說,‘你想要什么都可以’”。
另一個(gè)程序員馬上說到, “你絕對做了一個(gè)正確的選擇, 因?yàn)槟枪媚锏囊路?并不一定穿得了”。
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
