摘要:針對模糊C均值聚類(lèi)(Fuzzy c-Means Clustering, FCM)算法聚類(lèi)過(guò)程迭代的特點(diǎn),采用迭代式MapReduce模型對FCM算法進(jìn)行了優(yōu)化實(shí)現。Map函數計算每個(gè)樣本到聚類(lèi)中心的隸屬度,Reduce函數接收Map函數的中間輸出計算新的聚類(lèi)中心,傳遞模塊將最新聚類(lèi)中心傳送給原Map任務(wù)所在節點(diǎn),供新一輪MapReduce job使用。迭代式MapReduce模型在MapReduce基本模型上添加了傳遞模塊,有效解決了基本模型在處理迭代問(wèn)題上存在的不足。在Hadoop平臺中,分別使用基于迭代式MapReduce和MapReduce基本模型的FCM算法對變壓器進(jìn)行故障診斷。實(shí)驗結果表明,基于迭代式MapReduce的FCM算法診斷速度達到了基于MapReduce基本模型算法診斷速度的12倍以上,誤判率降低了12%~15%,有效提升了FCM算法的診斷效率。