关联分析一般分为两个步骤,分别为()。
A: 依据置信度,产生和选择候选集
B: 通过迭代找到数据库中的所有频繁项集
C: 利用频繁项集构造出满足用户最小置信度的关联规则
D: 利用提升度找到强关联规则
A: 依据置信度,产生和选择候选集
B: 通过迭代找到数据库中的所有频繁项集
C: 利用频繁项集构造出满足用户最小置信度的关联规则
D: 利用提升度找到强关联规则
举一反三
- ( )是关联规则发现算法的核心。 A: 设置最小支持度 B: 发现所有频繁项集 C: 找到所有的强规则 D: 发现一些频繁项集
- 关联规则数据挖掘算法的基本步骤是: A: 先找出事物数据库中最长频繁项集,再利用最长频繁项集逐层迭代生成渐短频繁项集,直到1频繁集 B: 先找出事物数据库中所有大于平均支持度的项集,再在这些项集中找出所有大于平均置信度的项集 C: 先找出事物数据库中所有大于平均置信度的项集,再在这些项集中找出所有大于平均支持度的项集 D: 先找出事物数据库中所有频繁项集,再利用频繁项集生成所需要的关联规则
- 由频繁项集产生的强关联规则必须满足( )。
- 下列有关关联规则挖掘的说法正确的是( )。 A: 先验原理可以描述为:如果一个项集是频繁的,那么包含它的所有项集也是频繁的 B: 利用先验原理可以帮助减少频繁项集产生时需要探查的候选项集个数 C: 具有较高支持度的项集同时也具有较高的置信度 D: 关联规则挖掘是发现满足最小支持度的所有项集代表的规则
- 以下有关关联算法错误的说法是哪个?( ) A: 关联算法可用于分析新闻库中经常一起出现的人物。 B: 提升度是强关联规则的一个必要条件。 C: 关联算法主要由2个步骤组成:首先是求频繁项目集,然后再筛选满足最小置信度的关联规则。 D: 关联算法是一种非监督学习算法。