麻豆黑色丝袜jk制服福利网站-麻豆精品传媒视频观看-麻豆精品传媒一二三区在线视频-麻豆精选传媒4区2021-在线视频99-在线视频a

千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機構(gòu)

手機站
千鋒教育

千鋒學(xué)習(xí)站 | 隨時隨地免費學(xué)

千鋒教育

掃一掃進入千鋒手機站

領(lǐng)取全套視頻
千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時隨地免費學(xué)習(xí)課程

當前位置:首頁  >  技術(shù)干貨  > k-Means聚類

k-Means聚類

來源:千鋒教育
發(fā)布人:xqq
時間: 2023-12-04 07:50:46 1701647446

k-Means聚類

1)k-Means聚類算法原理k-Means算法接受參數(shù)k,然后將事先輸入的n個數(shù)據(jù)對象劃分為k個聚類以便使所獲得的聚類滿足:同一聚類中的對象相似度較高;而不同聚類中的對象相似度較小。

聚類相似度是利用各聚類中對象的均值所獲得一個“中心對象”(引力中心)來進行計算的。

k-Means算法是最為經(jīng)典的基于劃分的聚類方法,是十大經(jīng)典數(shù)據(jù)挖掘算法之一。k-Means算法的基本思想是:以空間中k個點為中心進行聚類,對最靠近它們的對象歸類。通過迭代的方法,逐次更新各聚類中心的值,直至得到最好的聚類結(jié)果。

假設(shè)要把樣本集分為c個類別,算法描述如下:

① 適當選擇c個類的初始中心;

② 在第k次迭代中,對任意一個樣本,求其到c個中心的距離,將該樣本歸到距離最短的中心所在的類;

③ 利用均值等方法更新該類的中心值;

④ 對于所有的c個聚類中心,如果利用②及③的迭代法更新后其值保持不變,則迭代結(jié)束,否則繼續(xù)迭代。

該算法的較大優(yōu)勢在于簡潔和快速。算法的關(guān)鍵在于初始中心的選擇和距離公式。

2)k-Means聚類算法的實現(xiàn)

k-Means聚類算法的實現(xiàn)步驟如下。

(1)參數(shù)input指定待聚類的所有數(shù)據(jù)點,clusters指定初始聚類中心。如果指定參數(shù)k,由org.apache.mahout.clustering.kmeans.RandomSeedGenerator.buildRandom通過org.apache. hadoop.fs直接從input指定文件中隨機讀取k個點放入clusters中。

(2)根據(jù)原數(shù)據(jù)點和上一次迭代(或初始聚類)的聚類中心計算本次迭代的聚類中心,輸出到clusters-N目錄下。該過程由org.apache.mahout.clustering.kmeans下的KMeansMapper\KMeansCombiner\KMeansReducer\KMeansDriver實現(xiàn)。

① KMeansMapper:在configure中初始化mapper時讀入上一次迭代產(chǎn)生或初始聚類中心(每個mapper都讀入所有的聚類中心)。map方法對輸入的每個點都計算其最近的距離類,并加入輸出的key為該點所屬聚類ID,value為KMeansInfo實例,包含點的個數(shù)和各分量的累加和。

② KMeansCombiner:本地累加KMeansMapper輸出的同一聚類ID下的點個數(shù)和各分量的和。

③ KMeansReducer:累加同一聚類ID下的點個數(shù)和各分量的和,求本次迭代的聚類中心,并根據(jù)輸入Delta判斷該聚類是否已收斂。上一次迭代聚類中心與本次迭代聚類中心距離小于Delta。輸出各聚類中心和其是否收斂標記。

④ KMeansDriver:控制迭代過程直至超過較大迭代次數(shù)或所有聚類都已收斂每輪迭代后,KMeansDriver讀取其clusters-N目錄下的所有聚類。若所有聚類已收斂,則整個k-Means聚類過程收斂了。

3)k-Means聚類算法參數(shù)調(diào)整

manhout kmeans聚類有兩個重要參數(shù),即收斂Delta和較大迭代次數(shù)。通常情況下,Delta值越小,表示收斂條件越高,因此最終收斂的聚類數(shù)可能會降低,而較大迭代次數(shù)可通過觀察每次迭代后收斂聚類數(shù)決定,當收斂聚類數(shù)幾乎不再變化或振蕩時可停止迭代。

聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強師集結(jié),手把手帶你蛻變精英
請您保持通訊暢通,專屬學(xué)習(xí)老師24小時內(nèi)將與您1V1溝通
免費領(lǐng)取
今日已有369人領(lǐng)取成功
劉同學(xué) 138****2860 剛剛成功領(lǐng)取
王同學(xué) 131****2015 剛剛成功領(lǐng)取
張同學(xué) 133****4652 剛剛成功領(lǐng)取
李同學(xué) 135****8607 剛剛成功領(lǐng)取
楊同學(xué) 132****5667 剛剛成功領(lǐng)取
岳同學(xué) 134****6652 剛剛成功領(lǐng)取
梁同學(xué) 157****2950 剛剛成功領(lǐng)取
劉同學(xué) 189****1015 剛剛成功領(lǐng)取
張同學(xué) 155****4678 剛剛成功領(lǐng)取
鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
董同學(xué) 138****2867 剛剛成功領(lǐng)取
周同學(xué) 136****3602 剛剛成功領(lǐng)取

上一篇

譜聚類算法

下一篇

Canopy聚類
相關(guān)推薦HOT
嵌入式培訓(xùn)課程:探索技術(shù)的無限可能

近年來,嵌入式系統(tǒng)的廣泛應(yīng)用已經(jīng)深刻改變了我們的生活方式。從智能手機到智能家居,從汽車到醫(yī)療設(shè)備,嵌入式技術(shù)已經(jīng)成為現(xiàn)代社會不可或缺的...詳情>>

2023-12-12 11:02:35
嵌入式開發(fā):Linux網(wǎng)絡(luò)編程的探索與實踐

在當今的科技世界中,嵌入式系統(tǒng)已經(jīng)滲透到我們生活的方方面面,從智能手機、電視、汽車到醫(yī)療設(shè)備等。而在這些設(shè)備中,Linux網(wǎng)絡(luò)編程扮演著至...詳情>>

2023-12-12 09:55:55
Java游戲項目開發(fā):技術(shù)概覽與實踐

在數(shù)字化世界中,游戲已經(jīng)成為了人們休閑娛樂的重要方式之一。隨著科技的不斷進步,游戲開發(fā)行業(yè)也在不斷發(fā)展,而Java作為一門廣泛使用的編程語...詳情>>

2023-12-12 08:49:15
Web前端的基石:HTML

在數(shù)字化的時代,網(wǎng)頁設(shè)計已經(jīng)成為了一個重要的領(lǐng)域。而在這個領(lǐng)域中,HTML(HyperTextMarkupLanguage)無疑是最基礎(chǔ)、最重要的一環(huán)。它是構(gòu)建...詳情>>

2023-12-12 08:15:55
嵌入式開發(fā):內(nèi)存分配的方式

嵌入式系統(tǒng)開發(fā)中,內(nèi)存分配是一個至關(guān)重要的話題。嵌入式系統(tǒng)通常具有有限的內(nèi)存資源,因此合理的內(nèi)存分配方式對系統(tǒng)的性能和穩(wěn)定性至關(guān)重要。...詳情>>

2023-12-12 06:35:55
快速通道
主站蜘蛛池模板: 武侠古典一区二区三区中文| 国产精品美女www爽爽爽视频| 北条麻妃一本到高清在线观看| 波多野结衣视频全集| 久久精品视频一区二区三区| 国产无套乱子伦精彩是白视频 | 国产精品一区二区在线观看| 日本三级免费看| 午夜在线播放免费高清观看| 玉蒲团在线看| 男朋友想吻我腿中间那个部位| 欧美性色19p| 第四色亚洲色图| 四虎精品久久久久影院| 中文字幕julia中文字幕| 乱亲乱族| 欧美四虎| 女人张开腿让男人桶免费网站| 国产对白受不了了中文对白| 亚洲欧美日韩久久精品第一区| 国产黄色大片网站| 动漫人物桶动漫人物免费观看| 韩国女主播一区二区| 国产99视频精品免视看7| 日韩精品在线电影| 久久精品国产99精品国产2021| 久久精品国产欧美日韩99热| 日韩毛片| 国产成人在线电影| 中国美团外卖男男china| 国产综合精品| 全彩本子里番调教仆人| 亚洲黄色在线看| 国产女人18毛片水真多18精品| 美女被网站大全在线视频| 伊人动漫| 看黄a大片免费| 午夜dj影院| 国产性生交xxxxx免费| 日本黄色片免费观看| 亚洲午夜久久久久久尤物|