蒙特卡洛树搜索在模拟步骤中体现了探索与利用
举一反三
- 蒙特卡洛树搜索
- 下列关于蒙特卡洛树搜索算法的说法中,不正确的是 A: 选择过程体现了探索与利用的平衡 B: 算法进入扩展步骤时,当前结点的所有子结点必然都未被扩展 C: 模拟步骤采取的策略与选择步骤不一定相同 D: 反向传播只需要更新当前路径上已被扩展的结点
- 蒙特卡洛树搜索的主要流程有: A: 选择 B: 扩张 C: 模拟 D: 反馈
- 【多选题】蒙特卡洛树搜索的主要流程有( ) A: 选择 B: 扩张 C: 模拟 D: 军旗
- 下面哪一种有序组合是蒙特卡洛树搜索中一次正确的迭代步骤( ) A: 选举、扩展、模拟、反向传播 B: 反向传播、选举、扩展、模拟 C: 反向传播、扩展、模拟、选举 D: 扩展、模拟、采样、选举