强化学习可帮助水下自主航行器追踪深海中的目标动物

一种新的强化学习(RL)策略或可支持在深海中运行的自主研究机器人。该强化学习方法在加利福尼亚海岸外进行了测试,它可使某艘水面自主船能够在通信可靠性和GPS带宽品质开始受到影响的深度跟踪其水下对应物长达5小时以上。

即使目标动物之前已被标记,但在水下自主航行器(AUV)通信系统的可靠性和带宽受到损害时,也会给监测海洋物种带来挑战。一旦AUV潜入水下,水上系统同样也很难与它们保持联系——如果AUV自身的GPS系统在海洋深处发生故障,这将成为严重问题。

Ivan Masmitja和同事如今提出了一种深度强化学习框架,它可使水面机器人能够自主跟踪水下目标,从而规避了深海通信所遭遇的诸多挑战。这一团队为该框架创建了一个开源模型,并通过15小时以上的现场实验对该框架的成功进行了评估。

在该研究在海中进行期间,一艘自主性水面机器人使用强化学习方法对加利福尼亚海岸外30至60米深度间的某水下目标载具的位置进行了测量。在为时5小时的过程中,该方法帮助这个跟踪机器人确认了距离超过2.5公里的水下目标。

这种预测水下移动物体的去向并根据实时反馈微调这些预测的能力可能会对许多海洋研究工作提供帮助。作者写道:“这种能力对于那些从来不会到达海面且无法用GPS定位的物种来说尤其具有价值。”

来源:Science Robotics 、优睿科新闻平台

相关推荐