• 2021-04-14
    分类器是基于现有数据构造出一个模型或者函数,以将数据库中的数据映射到给定类别,从而可以应用于数据预测。常包含以下步骤:①在训练样本上执行分类器算法,生成分类模型。②在测试样本上执行分类模型,生成预测结果。③选定样本(包含正样本和负样本),将所有样本分成训练样本和测试样本。④根据预测结果,计算必要的评估指标,评估分类模型的性能。构造和实施分类器的正确顺序为()
  • ③①②④

    内容

    • 0

      在分类问题中,我们经常会遇到正负样本数据量不等的情况,比如正样本为10w条数据,负样本只有1w条数据,以下最合适的处理方法是()? A: 将负样本重复10次,生成10w样本量,打乱顺序参与分类 B: 直接进行分类,可以最大限度利用数据 C: 从10w正样本中随机抽取1w参与分类 D: 将负样本每个权重设置为10,正样本权重为1,参与训练过程

    • 1

      以下关于训练样本或测试样本描述错误的是 A: 训练样本可以通过前期测试对象的输入和对应的输出采集得到 B: 测试样本是在训练过程中未曾训练的未知新鲜数据 C: 测试样本只包含输入数据不包含输出数据 D: 测试样本用于检验训练模型的性能,一般包括识别精度和实时性等

    • 2

      装袋是指通过取样从原始训练数据集中创建m个“新”训练数据集(mbootstrap样本),在每个数据集上训练分类器分类,从m个分类器中获得多数投票。

    • 3

      【单选题】混淆矩阵中假负是指() A. 模型预测为正的正样本 B. 模型预测为负的正样本 C. 模型预测为正的负样本 D. 模型预测为负的负样本

    • 4

      分类是在一群已经知道类别标号的样本中,训练一种分类器,让其能够对某种未知的样本进行分类。