缺失值处理方法比较研究 |
| |
作者姓名: | 胡红晓 谢佳 韩冰 |
| |
作者单位: | 1. 河北医科大学图书馆 2. 西南财经大学统计学院 |
| |
摘 要: | 在数据收集过程中,由于各种原因可能造成数据集包括有噪声、不完整,甚至不一致的数据。这些问题将严重影响数据挖掘的质量和结果的稳健性,因此,对数据挖掘的对象进行预处理就显得尤为重要。数据的预处理分为数据清洗、数据集成、数据转换和数据消减。缺失值的处理是数据的清洗的第一步。对缺失值的处理有多种方法,本文将主要分析多重插补的方法。
|
关 键 词: | 缺失值 插补 多重插补 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|