基于粒子滤波的直接策略搜索强化学习算法研究期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于粒子滤波的直接策略搜索强化学习算法研究

摘要：	直接策略搜索强化学习算法的一个主要问题是只执行局部搜索,趋向于收敛到一些局部次优解,因此不能保证收敛到全局最优。文章提出的是一种直接政策搜索强化学习的全局搜索算法,不会陷入局部最优。实验结果表明了RLPF在策略空间探索的有效性,能够在策略空间直接进行全局搜索。
本文献已被 CNKI 等数据库收录！