‎（）就是程序或智能体（agent）通过与环境不断地进行交互学习完成从环境到动作的映射，学习的目标就是使累计回报最大化。 ‏ A: 监督学习 B: 非监督学习 C: 强化学习 D: 非强化学习 - 网课答案

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

公告：维护QQ群：833371870，欢迎加入！
公告：维护QQ群：833371870，欢迎加入！
公告：维护QQ群：833371870，欢迎加入！

2022-05-27

‎（）就是程序或智能体（agent）通过与环境不断地进行交互学习完成从环境到动作的映射，学习的目标就是使累计回报最大化。 ‏ A: 监督学习 B: 非监督学习 C: 强化学习 D: 非强化学习

‎（）就是程序或智能体（agent）通过与环境不断地进行交互学习完成从环境到动作的映射，学习的目标就是使累计回报最大化。 ‏
A: 监督学习
B: 非监督学习
C: 强化学习
D: 非强化学习

答案：

查看

举一反三