()有跟环境进行交互,从反馈当中进行不断的学习的过程。
A: 监督学习
B: 非监督学习
C: 强化学习
D: 线性回归
A: 监督学习
B: 非监督学习
C: 强化学习
D: 线性回归
C
举一反三
- ()有跟环境进行交互,从反馈当中进行不断的学习的过程。 A: 监督学习 B: 非监督学习 C: 强化学习 D: 线性回归
- ()有跟环境进行交互,从反馈当中进行不断的学习的过程
- ()就是程序或智能体(agent)通过与环境不断地进行交互学习完成从环境到动作的映射,学习的目标就是使累计回报最大化。 A: 监督学习 B: 非监督学习 C: 强化学习 D: 非强化学习
- 下列关于强化学习的说法正确的是? 在强化学习中,计算机通过不断与环境交互并通过环境反馈来逐渐适应环境|强化学习的概念是从Alphago战胜李世石之后才提出的|强化学习和有监督学习的过程相似,是“开环”的过程|强化学习属于无监督学习的一种,不需要有监督信息
- 下列关于强化学习的说法正确的是( )。 A: 强化学习属于无监督学习的一种,不需要有监督信息 B: 强化学习和有监督学习的过程相似,是“开环”的过程 C: 在强化学习中,计算机通过不断与环境交互并通过环境反馈来逐渐适应环境 D: 强化学习的概念是从Alphago战胜李世石之后才提出的
内容
- 0
以下关于强化学习的描述不正确的是(BCD)。 A: 在强化学习中,计算机通过不断与环境交互并通过环境反馈来逐渐适应环境 B: 强化学习和有监督学习的过程相似,是“开环”的过程 C: 强化学习属于无监督学习的一种,不需要有监督信息 D: 强化学习的概念是从Alphago战胜李世石之后才提出的
- 1
基于学习中的反馈情况,机器学习可以分为()。 A: 无监督学习 B: 有监督学习 C: 半监督学习 D: 强化学习
- 2
典型的“鸡尾酒会”问题中,提取出不同人说话的声音是属于 A: 非监督学习 B: 监督学习 C: 线性回归 D: 强化学习
- 3
以下哪种学习是“根据对环境的探索,对正确的行动进行奖励,模拟生物探索环境与积累经验的过程”?( ) A: 强化学习 B: 无监督学习 C: 半监督学习 D: 有监督学习
- 4
()是现在主要的机器学习算法。 A: 监督学习 B: 非监督学习 C: 强化学习 D: 非强化学习