摘要:目前常規的多源異構數據治理方法主要通過(guò)對數據屬性進(jìn)行判斷,從而實(shí)現分區域數據清洗,由于缺乏對非線(xiàn)性數據的分析,導致治理性能不佳;對此,提出基于云數據中心的多源異構數據治理技術(shù)。采用關(guān)系型數據庫中的ETL功能對數據進(jìn)行清洗,對數據轉換模式以及數據清洗規則進(jìn)行定義;引入互信息系數對數據相關(guān)程度進(jìn)行判定,并進(jìn)行非線(xiàn)性數據相關(guān)性分析;以云數據中心作為載體,對多源異構數據治理體系進(jìn)行構建;在實(shí)驗中,對提出的數據治理技術(shù)進(jìn)行了治理性能的檢驗;最終的實(shí)驗結果表明,提出的數據治理技術(shù)具備較高的查準率,對云數據中心多源異構數據具備較為理想的數據治理效果。