网课答案 | 资源分享
  • 首页
  • 最新收录
  • 微信公众号对接
  • 微信小程序对接
  • 联系站长
登录/注册
网课答案LOGO
关注微信公众号《课帮忙》查题
关注微信公众号《课帮忙》查题
关注微信公众号《课帮忙》查题
关注微信公众号《课帮忙》查题
关注微信公众号《课帮忙》查题
关注微信公众号《课帮忙》查题
  • 公告:维护QQ群:833371870,欢迎加入!
  • 公告:维护QQ群:833371870,欢迎加入!
  • 公告:维护QQ群:833371870,欢迎加入!
  • 2022-06-03
    监督学习引入了智能体和环境的概念,智能体通过学习和决策,执行最优的动作。( )
  • 查看

    公众号

    广告招租

    举一反三

    • ‎()就是程序或智能体(agent)通过与环境不断地进行交互学习完成从环境到动作的映射,学习的目标就是使累计回报最大化。 ‏ A: 监督学习 B: 非监督学习 C: 强化学习 D: 非强化学习
    • 强化学习的基本框架中,智能体通过()与环境进行交互时,环境会返给智能体一个当前的()
    • 智能体程序分别有哪些类型?() A: 感知智能体/决策智能体/学习智能体/规划智能体 B: 简单反射型智能体/基于模型的反射型智能体/基于目标的智能体/基于效用的智能体 C: 机器人/软件/硬件/算法 D: 类人智能体/类动物智能体
    • 2. 在强化学习中,智能体的学习过程是一个反复与环境进行交互,不断试错、不断进步的过程。在这个过程中,智能体在环境中会选择(),环境可能因此改变自身(),同时环境会反馈智能体以()。 A: 动作、状态、奖励 B: 状态、动作、奖励 C: 奖励、状态、动作 D: 动作、奖励、状态
    • 中国大学MOOC: 强化学习的基本框架中,智能体通过()与环境进行交互时,环境会返给智能体一个当前的()。

    热门题目

    • 面试中仪容修饰的原则是()
    • 青书学堂: (单选题) 下列哪项因素不会导致血管内外液体交换失衡( )(本题1.0分)
    • 磷矿粉
    • 激光一出现以后,就表现出许多与普通光不同的特征,包括()
    • 5.下列关于基础代谢率的叙述,哪项是错误的?
    • 《孙子兵法》全书共多少篇?
    • 急性闭角型青光眼急性发作期的体征有
    • 企业操纵利润的行为主要有
    • 渐晕不会降低轴外像点的照度。
    • 下面说法错误的是,下面属于人工智能产物的是

    相关标签

      决策 执行 入了 督学 智能 学习 最优 环境 引入 监督 概念 动作 通过

    查题对接

    • 微信查题

    站点信息

    • 统计数据:百度统计
    • 交换友链:QQ联系
    • 微信公众号:扫描二维码,关注我们
    友情链接:
    • 网课答案
    • 换友链点击联系

    Copyright © 2018-2023 网课答案 All Rights Reserved.  冀ICP备19017793号版权与免责声明