题目内容

何者叙述为非?()

A. 强化学习与监督学习最主要的区别在于其收到的反馈是:评估性和指导性
B. 监督学习给出的指导性反馈将会通过监督信号告知学习者应该要做出什么样的行为而获取更高的收益
C. 强化学习的评估性反馈意味着该学习系统只会告诉学习者当前的做法是好还是坏的
D. 强化学习的目的就是找到一个最佳的策略,从而使得主体发出一系列的动作后,收到的累积回报最多
E. 策略(Policy)指的是主体的行为,是一个从状态集合到动作集合的映像

查看答案
更多问题

定保邀约的关键管控点是()

A. 3个月
B. 4个月
C. 5个月
D. 6个月

CHB肝硬化的年发生率为()

A. 1%~10%
B. 2%~12%
C. 2%~10%
D. 3%~10%

当旅客机门口临时办理行李补托时,以下正确的是()。

A. 乘务员应提示旅客补托行李中是否有锂电池、自加热食品。
B. 乘务长需在机门口做好补托行李二次确认工作。
C. 只需由地服人员与旅客确认补托行李中有无锂电池。
D. 执行广州航线时,旅客机门口补托行李如无锂电池,则不需安排至后续航班。

下列关于屋面排水说法,正确的有()。

A. 16层建筑屋面宜采用内排水
B. 3层建筑可采用无组织排水
C. 5层建筑屋面宜采用有组织外排水
D. 湿陷性黄土地区宜采用无组织排水
E. 寒冷地区宜采用内排水

答案查题题库