下面哪一种有序组合是蒙特卡洛树搜索中一次正确的迭代步骤( )
A: 选举、扩展、模拟、反向传播
B: 反向传播、选举、扩展、模拟
C: 反向传播、扩展、模拟、选举
D: 扩展、模拟、采样、选举
A: 选举、扩展、模拟、反向传播
B: 反向传播、选举、扩展、模拟
C: 反向传播、扩展、模拟、选举
D: 扩展、模拟、采样、选举
举一反三
- 下面对蒙特卡洛树搜索描述不正确的是() A: 是一种基于采样的搜索方法 B: 是将上限置信区间算法(UCB)应用于游戏树的搜索方法 C: 其包含了选举、扩展、模拟和反向传播四个步骤 D: 是一种穷举式枚举的搜索方法
- 下列关于蒙特卡洛树搜索算法的说法中,不正确的是 A: 选择过程体现了探索与利用的平衡 B: 算法进入扩展步骤时,当前结点的所有子结点必然都未被扩展 C: 模拟步骤采取的策略与选择步骤不一定相同 D: 反向传播只需要更新当前路径上已被扩展的结点
- 中国大学MOOC: 下面哪一种有序组合是蒙特卡洛树搜索中一次正确的迭代步骤( )
- 关于蒙特卡洛树搜索算法说法正确的是 A: 向下递归选择过程中使用了UBC1算法 B: 模拟过程使用随机策略 C: 反向传播的是终止结点的代价或游戏终局分数 D: 蒙特卡洛树使用了穷尽式枚举法
- 蒙特卡洛树搜索在模拟步骤中体现了探索与利用