首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于MA2IDDPG算法的异构多无人机协同突防方法
引用本文:畅 鑫,李艳斌,赵 研,杜宇峰,刘东辉.基于MA2IDDPG算法的异构多无人机协同突防方法[J].河北工业科技,2022,39(4):328-334.
作者姓名:畅 鑫  李艳斌  赵 研  杜宇峰  刘东辉
作者单位:中国电子科技集团公司第五十四研究所;中国电子科技集团公司第五十四研究所;河北省电磁频谱认知与管控重点实验室;石家庄铁道大学经济管理学院
基金项目:中国博士后科学基金(2021M693002)
摘    要:为了形成智能化异构多无人机协同突防策略,提出了基于多智能体异步模仿深度确定性策略梯度算法的异构多无人机协同突防方法。首先,基于典型DDPG方法,采用异步并行框架进行改进,提高经验的收集效率。其次,分别构建基于专家经验知识的牵引性奖赏函数和基于任务结果的描述性奖赏函数。再次,通过分阶段训练后,使得深度神经网络产生的协同突防策略能够快速达到专家经验知识水平后,进一步提高对抗水平。最后,在仿真实验中,构建了异构多无人机协同突防环境,对改进方法和典型DDPG方法的对抗效果进行了对比。实验结果表明,MA2IDDPG方法能够有效产生多无人机协同突防策略,并且在训练阶段表现更为稳定且对抗效果更优。所设计的创新性MA2IDDPG方法框架可有效应用于无人机群控制领域,特别是对异构无人机群的智能控制方法研究具有重要参考意义。

关 键 词:人工智能  多智能体系统  深度强化学习  多智能体深度确定性策略梯度  异步并行框架  共享经验池  分阶段学习
收稿时间:2022/2/11 0:00:00
修稿时间:2022/6/5 0:00:00

Cooperative penetration method of heterogeneous multiple unmanned aerial vehicles based on multi-agent asynchronous imitative deep deterministic policy gradient algorithm
CHANG Xin,LI Yanbin,ZHAO Yan,DU Yufeng,LIU Donghui.Cooperative penetration method of heterogeneous multiple unmanned aerial vehicles based on multi-agent asynchronous imitative deep deterministic policy gradient algorithm[J].Hebei Journal of Industrial Science & Technology,2022,39(4):328-334.
Authors:CHANG Xin  LI Yanbin  ZHAO Yan  DU Yufeng  LIU Donghui
Abstract:
Keywords:artificial intelligence  multi-agent system  deep reinforcement learning  multi-agent deep deterministic policy gradient  asynchronous parallel framework  shared experience pool  phased learning
点击此处可从《河北工业科技》浏览原始摘要信息
点击此处可从《河北工业科技》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号