(单选题)
通过与环境交互、接受奖惩信号不断学习提高的机器学习算法是( )。
A.迁移学习
B.深度学习
C.强化学习
D.动志学习
参考答案:C
参考解析:
强化学习作为一种重要的机器学习方法,其最显著的特点是通过与环境交互,利用环境反馈的奖惩,即增强信号来调整和改善自己的行为,最终获得最佳策略。由于该方法具有对环境的先验知识要求低,可以在实时环境中进行在线学习,因此受到许多研究者的关注,同时在智能控制,序列决策等领域也得到了广泛应用。故ABD项错误,C项正确。故本题正确答案选C。
知识点:计算机发展趋势 计算机 计算机基本知识 通用 公基
