中国大学MOOC:概率规划问题描述可以通过马尔科夫决策过程进行说明,该决策过程的最基本模型可以看作是一个由()构成的四元组。_
举一反三
- 概率规划问题描述可以通过马尔科夫决策过程进行说明,该决策过程的最基本模型可以看作是一个由状态转移函数和( )构成的四元组。 A: 状态集合 B: 行动集合 C: 博弈规则 D: 报酬函数
- 概率规划问题描述可以通过马尔科夫决策过程进行说明,该决策过程的最基本模型可以看作是一个由( )构成的四元组。 A: 状态集合 B: 行动集合 C: 状态转移函数 D: 行动序列 E: 报酬函数
- 概率规划问题描述可以通过马尔科夫决策过程进行说明,该决策过程的最基本模型可以看作是一个由状态集合与( )构成的四元组。 A: 行动执行时间 B: 行动集合 C: 状态转移函数 D: 报酬函数
- 概率规划问题描述可以通过马尔科夫决策过程进行说明,该决策过程的最基本模型可以看作是一个由( )和报酬函数构成的四元组。 A: 状态集合 B: 行动集合 C: 状态转移函数 D: 逻辑联结词
- 关于马尔科夫决策过程,下列说法不正确的是( )。 A: 马尔科夫决策过程将客观世界的动态特性用状态转移来描述 B: 值迭代和策略迭代是求解马尔科夫决策过程问题的两个最基本的方法 C: 马尔科夫决策过程,是用逻辑联结词计算求解的 D: 马尔科夫决策过程,是用集合计算求解的
