
内容来源于:答案兔助手(https://www.gongxuke.net/)
强化学习和监督学习、无监督学习的区别是()。
A、监督学习带有标签
B、无监督学习没有标签
C、强化学习使用未标记的数据,根据延迟奖励学习策略
D、以上都错
正确答案:题库搜索,法宣在线助手薇-信:《go2learn》
强化学习框架可以用来描述所有的具有目标导向的任务。
A、正确
B、错误
正确答案:题库搜索,继续教育助理weixin:(xzs9519)
()年,Watkins提出的Q学习进一步拓展了强化学习的应用和完备了强化学习。
A、1954
B、1965
C、1957
D、1989
正确答案:题库搜索
亚运会每()年举办-次。
A、2
B、3
C、4
D、5
正确答案:题库搜索
搜索算法的输入是给定的问题,输出时表示为动作序列的方案。
A、正确
B、错误
正确答案:题库搜索
强化学习的目标是使得作出的一系列决策得到的总的奖励的期望最大化。
A、正确
B、错误
正确答案:题库搜索
以下说法不正确的是()。
A、贪心算法搜索速度较快,但未必能找到最优解
B、深度优先搜索通用性差,但是可以准确地找到较简单问题的解
C、宽度优先搜索的效率高于贪心算法
D、贪心算法又称盲目搜索
正确答案:题库搜索
广度优先搜索不是一个递归的过程,其算法也不是递归的。
A、正确
B、错误
正确答案:题库搜索