分类器是基于现有数据构造出一个模型或者函数,以将数据库中的数据映射到给定类别,从而可以应用于数据预测。常包含以下步骤:①在训练样本上执行分类器算法,生成分类模型。②在测试样本上执行分类模型,生成预测结果。③选定样本(包含正样本和负样本),将所有样本分成训练样本和测试样本。④根据预测结果,计算必要的评估指标,评估分类模型的性能。构造和实施分类器的正确顺序为()
③①②④
举一反三
- 【单选题】有关分类器的构造和实施步骤描述错误的是:() A. 选定样本,将所有样本分成训练样本和测试样本两部分; B. 在训练样本上执行分类器算法,生成分类模型; C. 在训练样本上执行分类模型,生成预测结果; D. 根据预测结果,计算必要的评估指标,评估分类模型的性能
- 下列对分类器的构造和实施大体步骤描述中,顺序正确的是()。 A: 选定样本-生成分类模型-评估分类模型-生成预测结果 B: 选定样本-生成分类模型-生成预测结果-评估分类模型 C: 生成分类模型-选定样本-评估分类模型-生成预测结果 D: 生成分类模型-评估分类模型-选定样本-生成预测结果
- 分类器是基于现有数据构造出一个模型或者函数,以将数据库中的数据映射到给定类别,从...的性能。构造和实施分类器的正确顺序为()
- 在测试样本上执行分类模型,可以()。
- 在分类问题中,我们经常会遇到正负样本数据量不等的情况,比如正样本为10万条数据,负样本只有1万条数据,以下合适的处理方法是 ( ) A: 从10万正样本中随机抽取1万参与分类 B: 将负样本重复10次,生成10万样本量,打乱顺序参与分类 C: 直接进行分类,可以最大限度利用数据 D: 将负样本每个权重设置为10,正样本权重为1,参与训练过程
内容
- 0
在分类问题中,我们经常会遇到正负样本数据量不等的情况,比如正样本为10w条数据,负样本只有1w条数据,以下最合适的处理方法是()? A: 将负样本重复10次,生成10w样本量,打乱顺序参与分类 B: 直接进行分类,可以最大限度利用数据 C: 从10w正样本中随机抽取1w参与分类 D: 将负样本每个权重设置为10,正样本权重为1,参与训练过程
- 1
以下关于训练样本或测试样本描述错误的是 A: 训练样本可以通过前期测试对象的输入和对应的输出采集得到 B: 测试样本是在训练过程中未曾训练的未知新鲜数据 C: 测试样本只包含输入数据不包含输出数据 D: 测试样本用于检验训练模型的性能,一般包括识别精度和实时性等
- 2
装袋是指通过取样从原始训练数据集中创建m个“新”训练数据集(mbootstrap样本),在每个数据集上训练分类器分类,从m个分类器中获得多数投票。
- 3
【单选题】混淆矩阵中假负是指() A. 模型预测为正的正样本 B. 模型预测为负的正样本 C. 模型预测为正的负样本 D. 模型预测为负的负样本
- 4
分类是在一群已经知道类别标号的样本中,训练一种分类器,让其能够对某种未知的样本进行分类。