基于MA2IDDPG算法的异构多无人机协同突防方法 Cooperative penetration method of heterogeneous multiple unmanned aerial vehicles based on multi-agent asynchronous imitative deep deterministic policy gradient algorithm期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于MA2IDDPG算法的异构多无人机协同突防方法

引用本文：	畅鑫,李艳斌,赵研,杜宇峰,刘东辉.基于MA2IDDPG算法的异构多无人机协同突防方法[J].河北工业科技,2022,39(4):328-334.

作者姓名：	畅鑫李艳斌赵研杜宇峰刘东辉

作者单位：	中国电子科技集团公司第五十四研究所;中国电子科技集团公司第五十四研究所；河北省电磁频谱认知与管控重点实验室;石家庄铁道大学经济管理学院

基金项目：	中国博士后科学基金（2021M693002）

摘要：	为了形成智能化异构多无人机协同突防策略，提出了基于多智能体异步模仿深度确定性策略梯度算法的异构多无人机协同突防方法。首先，基于典型DDPG方法，采用异步并行框架进行改进，提高经验的收集效率。其次，分别构建基于专家经验知识的牵引性奖赏函数和基于任务结果的描述性奖赏函数。再次，通过分阶段训练后，使得深度神经网络产生的协同突防策略能够快速达到专家经验知识水平后，进一步提高对抗水平。最后，在仿真实验中，构建了异构多无人机协同突防环境，对改进方法和典型DDPG方法的对抗效果进行了对比。实验结果表明，MA2IDDPG方法能够有效产生多无人机协同突防策略，并且在训练阶段表现更为稳定且对抗效果更优。所设计的创新性MA2IDDPG方法框架可有效应用于无人机群控制领域，特别是对异构无人机群的智能控制方法研究具有重要参考意义。
关键词：	人工智能多智能体系统深度强化学习多智能体深度确定性策略梯度异步并行框架共享经验池分阶段学习
收稿时间：	2022/2/11 0:00:00
修稿时间：	2022/6/5 0:00:00
Cooperative penetration method of heterogeneous multiple unmanned aerial vehicles based on multi-agent asynchronous imitative deep deterministic policy gradient algorithm

CHANG Xin,LI Yanbin,ZHAO Yan,DU Yufeng,LIU Donghui.Cooperative penetration method of heterogeneous multiple unmanned aerial vehicles based on multi-agent asynchronous imitative deep deterministic policy gradient algorithm[J].Hebei Journal of Industrial Science & Technology,2022,39(4):328-334.

Authors:	CHANG Xin LI Yanbin ZHAO Yan DU Yufeng LIU Donghui

Abstract:

Keywords:	artificial intelligence multi-agent system deep reinforcement learning multi-agent deep deterministic policy gradient asynchronous parallel framework shared experience pool phased learning

	点击此处可从《河北工业科技》浏览原始摘要信息
	点击此处可从《河北工业科技》下载免费的PDF全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏