启发性信息包含以下哪几种信息?
A. 帮助确定扩展节点的信息
B. 帮助决定哪些后继节点应被生成的信息
C. 能决定在扩展一个节点时哪些节点应从搜索树上删除的信息。
D. 节点所被包含的信息重要程度
迁移学习常用方法有( )
A. 基于样本的迁移学习
B. 基于特征的迁移学习
C. 基于模型的迁移学习
D. 基于关系的迁移学习
强化学习的方法主要有( )
A. 基于价值的强化学习(Value-based RL)
B. 基于策略的强化学习(Policy-based RL)
C. 深度强化学习(DRL)
D. 逆强化学习(Inverse RL)
强化学习的难点有( )
A. 状态和行为维度高
B. 状态信息误差大
C. 现有模型限制
D. 样本量过大,计算复杂