當前位置:知知館 >

經驗

> 資料預處理的主要方法有哪些

資料預處理的主要方法有哪些

資料預處理的主要方法有哪些

資料的預處理是指對所收集資料進行分類或分組前所做的稽核、篩選、排序等必要的處理;主要方法有資料清理,資料整合,資料變換,資料歸約等。

資料清理;資料清理例程通過填寫缺失的值、光滑噪聲資料、識別或刪除離群點並解決不一致性來“清理”資料。主要是達到如下目標:格式標準化,異常資料清除,錯誤糾正,重複資料的清除。資料整合;資料整合例程將多個數據源中的資料結合起來並統一儲存,建立資料倉庫的過程實際上就是資料整合。資料變換;通過平滑聚集,資料概化,規範化等方式將資料轉換成適用於資料探勘的形式。資料歸約;資料探勘時往往資料量非常大,在少量資料上進行挖掘分析需要很長的時間,資料歸約技術可以用來得到資料集的歸約表示,它小得多,但仍然接近於保持原資料的完整性,並結果與歸約前結果相同或幾乎相同。
標籤: 預處理
  • 文章版權屬於文章作者所有,轉載請註明 https://zhizhiguan.com/zh-tw/jingyan/5j2vxr.html