數據挖掘自動查詢大型數據庫中的預測信息。很久以前,大量的人工分析問題,可以快速直接的從數據本身得出結論。
2.相關分析
數據關聯是可以在數據中找到的重要知識。如果兩個或兩個以上的變量之間存在某種規律,這就叫相關性。關聯可以分為簡單關聯、事件關聯和因果關聯。關聯分析的主要目的是找出數據庫中隱藏的網絡。數據庫中的關聯數據有時未知,有時已知,有時不確定,因此關聯分析產生的規則具有可信度。
3.使聚集
數據庫中的記錄可以分成壹系列有意義的子集,即聚類。聚類可以提高人們對客觀現實的認識,是概念描述和偏差分析的前提。聚類主要包括傳統的模式識別方法和數學分類。
4.概念描述
概念描述是對目標類別內容的描述,是對該類別相關特征的概括。概念描述分為特征描述和區別描述,描述不同對象之間的差異。公式化壹種特征描述只會影響所有對象的* * *相同元素。描述差異的方法還有很多,比如決策樹法、遺傳法等。