摘要:大數據、云計算技術(shù)的迅猛發(fā)展為挖掘氣象數據豐富的科研和經(jīng)濟價(jià)值提供了技術(shù)支撐,促進(jìn)了Hadoop及其包含的文件存儲系統(HDFS,Hadoop Distributed File System)和分布式計算模型在氣象數據處理領(lǐng)域廣泛應用。由于氣象數據具有大數據的4V特征,還需要引入新的數據處理算法來(lái)提高氣象數據處理效率。通過(guò)對決策樹(shù)算法原理的研究,基于Hadoop云平臺,創(chuàng )建隨機森林模型,為數據挖掘算法在云平臺上的應用提供一種新的可能性。基于決策樹(shù)(CART,Classification And Regression Trees)挖掘算法的氣象大數據云平臺設計,采用Hadoop系統架構和MapReduce工作流程,對氣象大數據云平臺采用集群部署。平臺總體架構分為基礎設施層、數據管理與處理層、應用層,減少了決策樹(shù)建立的時(shí)間,實(shí)現了氣象數據高效加工和挖掘分析等平臺功能。