迁移学习常用方法有( )
A. 基于样本的迁移学习
B. 基于特征的迁移学习
C. 基于模型的迁移学习
D. 基于关系的迁移学习
强化学习的方法主要有( )
A. 基于价值的强化学习(Value-based RL)
B. 基于策略的强化学习(Policy-based RL)
C. 深度强化学习(DRL)
D. 逆强化学习(Inverse RL)
强化学习的难点有( )
A. 状态和行为维度高
B. 状态信息误差大
C. 现有模型限制
D. 样本量过大,计算复杂
请问谓词公式中(∀x)(P(x,y)→Q(x,y))∨R(x,y)的自由变元有哪几个?
A. P(x,y)中的x
B. R(x,y)中的x
C. Q(x,y)中的x
D. P(x,y)中的y