航空航天科学与工程论文_保障无人机安全通信的

来源：安全与环境学报 【在线投稿】栏目：期刊导读时间：2021-10-07

文章摘要:在无人机服务多个地面移动用户并存在一个窃听者窃听信息的安全通信场景中，为了最大化安全速率，本文提出一种新的深度强化学习算法对无人机3D轨迹进行优化，该算法名为正确轨迹深度确定性策略梯度算法（correct trajectory - deep deterministic policy gradient， CT-DDPG）。CT-DDPG算法使用多个深度神经网络与环境交互，采用修正输出层激活函数值的方式，代替传统的使用多个激活函数的方法，简化深度神经网络结构。同时对无人机的飞行轨迹进行修正，使无人机始终处于安全速率最大化的最佳位置。与其他强化学习算法相比，该算法训练时间短，执行时能实时更新无人机的位置。仿真结果表明，所提出的算法能够快速收敛，在保障无人机安全通信的情况下完成飞行任务。

文章关键词:

论文分类号:V279;V249