IEEE Open Journal of Vehicular Technology (OJVT) 是一本开放获取的全电子期刊,发表原创高质量论文,涵盖移动无线电、机动车辆和陆地交通领域电气和电子工程的理论、实验和操作层面。我们的期刊不仅欢迎原创高质量论文,也欢迎以行业为中心的出版物,重点关注研究成果并提出对进行类似研究的人员有用的想法。
我们重点介绍了一篇由同济大学和阿拉伯联合酋长国大学的研究人员共同撰写的论文,论文提出并探讨了将大型语言模型(LLMs)与无人机(UAVs)融合的变革性潜力,标志着自主系统新时代的到来。

Large Language Models for UAVs: Current State and Pathways to the Future
Authors: Shumaila Javaid; Hamza Fahim; Bin He; Nasir Saeed
Published in volume 5, IEEE Open Journal of Vehicular Technology
IEEExplore version: https://ieeexplore.ieee.org/document/10643253

现代无人机在执行如图像采集或按照预设航线飞行等任务时表现出色,但当环境发生变化或需要理解复杂指令时,它们往往难以适应。在日常生活中,我们常看到无人机因为无法理解语音指令或无法即时重新规划飞行路径而“卡住”。我们的研究提出了一个简单而前沿的想法:如果无人机也能使用大型语言模型——为聊天机器人提供智能的“语言大脑”——来做出更聪明的决策,会怎样?

我们并不将无人机的感知摄像头和基于语言的人工智能视为两个独立的工具,而是展示了如何将它们融合为一个统一的系统。想象一下,你对无人机说:“勘察那座倒塌的建筑,寻找幸存者。” 它能够解析指令、规划高效的搜索路径,甚至描述它所看到的情况。

为了实现这一目标,我们需要克服一系列现实挑战,例如:如何在无人机有限的机载计算资源上运行大型语言模型;如何防止人工智能“幻觉”(即编造虚假信息);以及当无人机需要与其他无人机或地面基站共享数据时,如何确保通信安全。
我们的论文详细介绍了实现这一系统的关键构建模块,包括:如何将强大的大型语言模型压缩以适配小型飞行计算机;如何将文本指令与传感器数据(如摄像头、激光雷达、GPS)在实时环境中融合;以及如何验证无人机在光照不佳或网络连接不稳定等变化条件下依然保持可靠“理解”。

通过提出具体解决方案,例如机载微调技术、多模态传感器融合策略,以及轻量化的可信度检查机制,我们为将今天的无人机转变为真正具备对话能力和适应能力的智能机器提供了一条可落地的路径。

简而言之,这项研究展示了如何将先进的大型语言“智能大脑”与空中机器人深度融合,不止停留在理论层面,而是面向现实挑战,解决如有限计算能力、稳定的传感器与语言融合、以及可验证的AI输出等关键问题。我们不仅回顾了已有的工作,更提供了一份清晰、逐步的蓝图,帮助工程师和研究人员打造不只是能“飞”的无人机,而是能够“对话”、理解复杂指令,并像人与人交流那样自然地完成任务的智能系统。

——

为了支持机动车辆和陆地交通领域日益增长的投稿数量,特别是涉及 (a) 推进和辅助功能的部件、系统和动力;以及 (b) 传感和感知以及汽车应用的多模态和高光谱成像等领域的投稿,OJVT正在寻找至少两名进行这些研究的研究人员在2026 年 1 月 1 日加入编辑委员会。如果您认识任何符合条件的研究人员,请他们在 2025 年 9 月 1 日之前发送简历至 OJVT 主编Dr. Edward Au, [email protected]