以下不属于数据科学中数据预处理过程的是()
A: 小赵使用重复过滤方法对数据集中的“重复类”的冗余数据进行处理
B: 小周对数据进行“0-1标准化”处理
C: 小吴使用爬虫软件爬取了与某一电影评论有关的数据
D: 小刘对数据集中的“姓名”、“家庭住址”、“身份证号”等个人隐私数据进行了删除处理
A: 小赵使用重复过滤方法对数据集中的“重复类”的冗余数据进行处理
B: 小周对数据进行“0-1标准化”处理
C: 小吴使用爬虫软件爬取了与某一电影评论有关的数据
D: 小刘对数据集中的“姓名”、“家庭住址”、“身份证号”等个人隐私数据进行了删除处理
举一反三
- 数据清洗主要是删除原始数据集中的无关数据、重复数据 ,平滑噪声数据,处理缺失值、异常值等。
- 在进行数据的统计分析之前,一般需要完成数据的预处理,以下属于数据的预处理内容的是? A: 缺失值和异常数据的处理 B: 数据的转换处理 C: 峰度和偏度处理 D: 数据抽样
- 在进行数据的统计分析之前,一般需要完成数据的预处理,以下哪一项不属于数据的预处理内容: A: 缺失值和异常数据的处理; B: 峰度和偏度处理; C: 数据的转换处理; D: 数据抽样;
- 过滤流就是数据输入输出时进行数据转换、数据缓冲等过滤处理的类。( )
- 数据清洗(Datacleaning)是对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。其主要处理类型有()。 A: 残缺数据 B: 错误数据 C: 重复数据 D: 多余数据