(单选题)
大数据预处理指的是在进行数据分析之前,先对采集到的原始数据所进行的一系列操作,旨在提高数据质量,为后期分析工作奠定基础。大数据预处理不包括以下哪一项?( )。
A.数据规约
B.数据采集
C.数据转换
D.数据清理
参考答案:B
参考解析:
大数据预处理的方法包括:数据清理:数据清理例程通过填写缺失的值、光滑噪声数据、识别或删除离群点并解决不一致性来“清理”数据。主要是达到如下目标:格式标准化,异常数据清除,错误纠正,重复数据的清除。数据集成:数据集成例程将多个数据源中的数据结合起来并统一存储,建立数据仓库的过程实际上就是数据集成。数据变换:通过平滑聚集,数据概化,规范化等方式将数据转换成适用于数据挖掘的形式。数据规约:数据挖掘时往往数据量非常大,在少量数据上进行挖掘分析需要很长的时间,数据归约技术可以用来得到数据集的归约表示,它小得多,但仍然接近于保持原数据的完整性,并结果与归约前结果相同或几乎相同。没有B项数据采集。故本题正确答案选B。
知识点:计算机发展趋势 计算机 计算机基本知识 通用 公基
