摘要:由于當今的網(wǎng)絡(luò )數據是海量的,因此科研人員對某些問(wèn)題進(jìn)行研究時(shí)需要將不同屬性的數據從中提取出來(lái),然而在提取這些數據之前需要將相同數據進(jìn)行聚類(lèi)。數據聚類(lèi)的過(guò)程,也就是尋找數據最優(yōu)屬性的過(guò)程,然而人工蟻群就是一種尋找問(wèn)題最優(yōu)解的算法,因此在本文中再次將蟻群算法在聚類(lèi)中進(jìn)行應用。由本文提出的聚類(lèi)算法可以分為兩個(gè)部分,第一部分是:通過(guò)相似性算法來(lái)衡量數據之間的相似度,第二部分是:根據第一部分的計算結果,再采用蟻群算法為需要聚類(lèi)的數據選擇不同的聚類(lèi)中心,從而對不同屬性的數據進(jìn)行聚類(lèi),經(jīng)過(guò)以上兩個(gè)過(guò)程的計算,可以實(shí)現對數據的聚類(lèi)。在本文中進(jìn)行數據聚類(lèi)時(shí)采用的相似性度量來(lái)代替距離的計算,是本文創(chuàng )新點(diǎn)之一,采用蟻群算法在聚類(lèi)過(guò)程中來(lái)選擇聚類(lèi)中心也是本文的創(chuàng )新所在。