• 2022-05-28
    在分类问题中,我们经常会遇到正负样本数据量不等的情况,比如正样本为10万条数据,负样本只有1万条数据,以下合适的处理方法是 ( )
    A: 从10万正样本中随机抽取1万参与分类
    B: 将负样本重复10次,生成10万样本量,打乱顺序参与分类
    C: 直接进行分类,可以最大限度利用数据
    D: 将负样本每个权重设置为10,正样本权重为1,参与训练过程
  • A,B,D

    举一反三

    内容

    • 0

      关于样本数据的说法不正确的是() A: 全部的样本数据都应该参与训练 B: 样本数据最好分为测试集和训练集 C: 样本数据训练时最好打乱顺序 D: 特征数据需要归一化

    • 1

      【单选题】混淆矩阵中假负是指() A. 模型预测为正的正样本 B. 模型预测为负的正样本 C. 模型预测为正的负样本 D. 模型预测为负的负样本

    • 2

      机器学习的三种分类,主要是依据样本数据集的( )进行分类。 A: 样本数量 B: 样本标签 C: 样本结构 D: 样本容量

    • 3

      有数据集正样本100个,负样本100个,模型F对样本进行预估预测为正样本的有80个(其中真的是正样本的是60个),请问该模型的召回率是多少?() A: 0.6 B: 0.75 C: 0.7 D: 0.5

    • 4

      从一个总体中随机抽取一个样本量为10的样本,如果该样本的方差为零,则下面说法中正确的是()。 A: 总体的方差也为零 B: 样本的均值等于样本的中位数 C: 在这个样本中,10个数据的数值相等 D: 总体的均值为零