• 2022-06-05
    AlphaGo主要由以下哪几部分组成?()
    A: 策略网络
    B: 价值网络
    C: 蒙特卡洛树搜索
    D: 每个动作的价值(计算生成Q表)
  • A,B,C

    内容

    • 0

      Alpha Go主要采用了那些技术? A: 深度学习 B: 价值网络 C: 蒙特卡洛树搜索 D: 盲目搜索

    • 1

      关于AlphaGo使用的蒙特卡洛树搜索,以下说法不正确的是()

    • 2

      AlphaGo主要使用的技术,不包括(<br/>)。 A: 蒙特卡洛树搜索 B: 专家系统 C: 深度学习 D: 强化学习

    • 3

      Q-learning算法包括哪些步骤?() A: 更新策略网络 B: 根据Q表和随机策略选择动作 C: 根据动作计算状态和奖励 D: 迭代更新Q表

    • 4

      AlphaGo综合使用了强化学习、蒙特卡罗树搜索、深度学习。