在分类问题中,我们经常会遇到正负样本数据量不等的情况,比如正样本为10万条数据,负样本只有1万条数据,以下合适的处理方法是 ( )
A: 从10万正样本中随机抽取1万参与分类
B: 将负样本重复10次,生成10万样本量,打乱顺序参与分类
C: 直接进行分类,可以最大限度利用数据
D: 将负样本每个权重设置为10,正样本权重为1,参与训练过程
A: 从10万正样本中随机抽取1万参与分类
B: 将负样本重复10次,生成10万样本量,打乱顺序参与分类
C: 直接进行分类,可以最大限度利用数据
D: 将负样本每个权重设置为10,正样本权重为1,参与训练过程
A,B,D
举一反三
- 在分类问题中,我们经常会遇到正负样本数据量不等的情况,比如正样本为10w条数据,负样本只有1w条数据,以下最合适的处理方法是()? A: 将负样本重复10次,生成10w样本量,打乱顺序参与分类 B: 直接进行分类,可以最大限度利用数据 C: 从10w正样本中随机抽取1w参与分类 D: 将负样本每个权重设置为10,正样本权重为1,参与训练过程
- 人工神经网络在学习过程中,需要通过数据集进行训练。下列关于训练数据集描述正确的是()我们经常会需要一个样本集,它既有正例也有反例,那些支持这个结论的就是正例,不支持就是反例。 A: 只有正样本 B: 既要有负样本、又要有正样本 C: 只有负样本 D: 当负样本训练出来的结果一样也是负样本,那么可以不用调节参数模型
- 分类器是基于现有数据构造出一个模型或者函数,以将数据库中的数据映射到给定类别,从而可以应用于数据预测。常包含以下步骤:①在训练样本上执行分类器算法,生成分类模型。②在测试样本上执行分类模型,生成预测结果。③选定样本(包含正样本和负样本),将所有样本分成训练样本和测试样本。④根据预测结果,计算必要的评估指标,评估分类模型的性能。构造和实施分类器的正确顺序为()
- 混淆矩阵中FN(False Negative)的含义是? A: 将负样本识别为负样本的数量(或概率) B: 将正样本识别为负样本的数量(或概率) C: 将负样本识别为正样本的数量(或概率) D: 将正样本识别为正样本的数量(或概率)
- 下列对混淆矩阵说法正确的是()。 A: TP:将正样本识别为正样本的数目(概率) B: FP:将负样本识别为正样本的数目(概率) C: FN:将正样本识别为负样本的数目(概率) D: TN:将负样本识别为正样本的数目(概率)
内容
- 0
关于样本数据的说法不正确的是() A: 全部的样本数据都应该参与训练 B: 样本数据最好分为测试集和训练集 C: 样本数据训练时最好打乱顺序 D: 特征数据需要归一化
- 1
【单选题】混淆矩阵中假负是指() A. 模型预测为正的正样本 B. 模型预测为负的正样本 C. 模型预测为正的负样本 D. 模型预测为负的负样本
- 2
机器学习的三种分类,主要是依据样本数据集的( )进行分类。 A: 样本数量 B: 样本标签 C: 样本结构 D: 样本容量
- 3
有数据集正样本100个,负样本100个,模型F对样本进行预估预测为正样本的有80个(其中真的是正样本的是60个),请问该模型的召回率是多少?() A: 0.6 B: 0.75 C: 0.7 D: 0.5
- 4
从一个总体中随机抽取一个样本量为10的样本,如果该样本的方差为零,则下面说法中正确的是()。 A: 总体的方差也为零 B: 样本的均值等于样本的中位数 C: 在这个样本中,10个数据的数值相等 D: 总体的均值为零