數據清理程序是通過填充缺失值、平滑噪聲數據、識別或刪除異常值以及解決不壹致性來執行的?清理數據?。
2.數據集成
數據集成過程集成來自多個數據源的數據。
3.數據協議
數據規格說明是為了得到數據集的簡化表示。數據規格包括尺寸規格和數值規格。
4.數據轉換
通過改變標準化、數據離散化和概念分層的方法,可以在多個抽象層次上進行數據挖掘。數據轉換操作是提高數據挖掘效果的附加預處理過程。