国产欧美精品一区二区,中文字幕专区在线亚洲,国产精品美女网站在线观看,艾秋果冻传媒2021精品,在线免费一区二区,久久久久久青草大香综合精品,日韩美aaa特级毛片,欧美成人精品午夜免费影视

Hadoop平臺下基于優(yōu)化X-means算法的大數據聚類(lèi)研究
DOI:
CSTR:
作者:
作者單位:

廣東農工商職業(yè)技術(shù)學(xué)院

作者簡(jiǎn)介:

通訊作者:

中圖分類(lèi)號:

基金項目:

廣東省普通高校重點(diǎn)領(lǐng)域專(zhuān)項(新一代信息技術(shù))課題(2021ZDZX1138)


Research on Large Cluster Analysis Based on Optimized X-means Algorithm under Hadoop Platform
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 圖/表
  • |
  • 訪(fǎng)問(wèn)統計
  • |
  • 參考文獻
  • |
  • 相似文獻
  • |
  • 引證文獻
  • |
  • 資源附件
  • |
  • 文章評論
    摘要:

    針對現有聚類(lèi)方法對數據處理規模的局限性,解決數據聚類(lèi)效果差的問(wèn)題,在Hadoop平臺的支持下提出基于優(yōu)化X-means算法的大數據聚類(lèi)方法。利用Hadoop平臺架構與函數采集大數據樣本,通過(guò)缺失補償、噪聲濾波、歸一化等步驟,實(shí)現初始樣本數據的預處理。選擇大數據聚類(lèi)中心,分別提取聚類(lèi)中心數據與其他所有數據樣本的特征,計算數據樣本與聚類(lèi)中心之間的特征相似度。以相似度度量結果為聚類(lèi)判定條件,利用優(yōu)化X-means算法確定數據所屬類(lèi)型,最終實(shí)現大數據的聚類(lèi)處理工作。通過(guò)聚類(lèi)效果測試實(shí)驗得出結論:在有、無(wú)兩種實(shí)驗條件下,與傳統聚類(lèi)方法相比,優(yōu)化設計方法的查全率和查準率分別提升了4.75%和4.5%,同時(shí)優(yōu)化聚類(lèi)方法得出數據具有更高利用率。

    Abstract:

    In response to the limitations of existing clustering methods on data processing scale and the problem of poor data clustering performance, a big data clustering method based on optimized X-means algorithm is proposed with the support of Hadoop platform. Utilizing the Hadoop platform architecture and functions to collect big data samples, preprocessing the initial sample data is achieved through steps such as missing compensation, noise filtering, and normalization. Select a big data clustering center, extract the features of the clustering center data and all other data samples, and calculate the feature similarity between the data samples and the clustering center. Using similarity measurement results as clustering criteria, the optimized X-means algorithm is used to determine the type of data, ultimately achieving clustering processing of big data. Through clustering effectiveness testing experiments, it was concluded that under both experimental conditions, the recall and precision of the optimized design method were improved by 4.75% and 4.5%, respectively, compared to traditional clustering methods. At the same time, the optimized clustering method resulted in higher data utilization.

    參考文獻
    相似文獻
    引證文獻
引用本文

張鵬飛,江岸,熊念. Hadoop平臺下基于優(yōu)化X-means算法的大數據聚類(lèi)研究計算機測量與控制[J].,2023,31(12):284-289.

復制
分享
文章指標
  • 點(diǎn)擊次數:
  • 下載次數:
  • HTML閱讀次數:
  • 引用次數:
歷史
  • 收稿日期:2023-06-13
  • 最后修改日期:2023-07-05
  • 錄用日期:2023-07-06
  • 在線(xiàn)發(fā)布日期: 2023-12-27
  • 出版日期:
文章二維碼
栖霞市| 泰顺县| 桃园县| 景东| 淳化县| 阳春市| 安图县| 大竹县| 永修县| 东莞市| 深圳市| 双牌县| 洞口县| 汝州市| 奇台县| 鄢陵县| 比如县| 永胜县| 枞阳县| 庆阳市| 京山县| 五河县| 陇川县| 茶陵县| 澄江县| 奈曼旗| 阿拉善左旗| 顺昌县| 平远县| 栾城县| 保德县| 墨竹工卡县| 威信县| 棋牌| 松溪县| 中山市| 万安县| 安远县| 中江县| 资中县| 盘山县|