6小时模型迭代的背后故事:华为云ModelArts+HiLens在空管领域怎么用?

InfoQ

2020 年 11 月 20 日

6小时模型迭代的背后故事:华为云ModelArts+HiLens在空管领域怎么用?

在交通运输行业,民用航空无疑是“高大上”的典型代表。资料显示,全球航空业年直接产出超过 7 千亿美元,带动经济总量 2.7 万亿美元,是工业领域的重要支柱之一,也是传统行业中的明星与骄傲。


近年来,随着云计算、大数据、人工智能等技术在 IT 产业掀起热潮,飞机制造商、航空公司和机场运营方都希望借助新一代 IT 技术解决业内现存的诸多困难与障碍,提供更加安全高效、成本合理的运输服务。


在航空业数字化转型的大趋势中,机场运营方的航空管制智能改造是当下的一大热点项目。航空交通管制(ATC)是航空运输的管理枢纽。机场运营方特别希望能够借助前沿 IT 技术来提升 ATC 的自动化水平,消除潜在的安全隐患,同时提升机场的运营效率。


在这样的需求推动下,聚焦智能航空领域、专注人工智能技术和应用研发的上海麦图信息科技有限公司希望通过 AI 技术解决机场空管面临的诸多挑战。在研发机场智能塔台产品的过程中,麦图公司的团队选择了华为云 EI 的 ModelArts+HiLens 端云协同平台作为底层基础,快速开发出了高水平、低成本、符合实践要求的解决方案,获得了客户的认可与好评;项目也获得 2020 华为开发者大赛秋季赛《人工智能大赛》金奖。2020 年 11 月 17 日,华为云 DevRun 开发者沙龙邀请到了麦图团队分享其在华为云的帮助下创建产品的历程与经验。


从左到右:麦图团队——CTO 王宏锋;华为云 MVP、智能塔台技术总监徐擎阳;首席 AI 架构师李鑫;

AI 算法专家孔维国


打造智能塔台:已有痛点与解决思路


在繁忙的空港塔台,管制员需要时刻集中注意力,同时观察停机坪及跑道情况、与飞行员语音沟通、操控复杂的仪表面板等,并随时对突发事件做出正确的判断和应对。在航班密集期间,如此复杂的操作给管制员施加了巨大的压力,增加了忙中出错的潜在风险。另一方面,塔台本身的视野往往受限,尤其对机场跑道周围的活动很难准确把握。当出现“跑道侵入事件”时,管制员很难第一时间发现并通知飞行员规避,进而引发跑道安全事故。

为了帮助管制员分担压力,更准确地把握机场全景实况信息,特别是有效预防跑道侵入事件,麦图公司团队根据机场客户需求反馈,迭代开发了一套智能塔台系统。整套系统主要分为三大模块:


1、语音识别和自动化指令输出系统。该系统可以将管制员与飞行员的语音通信内容转化为结构化的文字指令及应答报告,显示在塔台的屏幕管理界面上。

2、机场全景摄像监控网络,将机场各处的视频监控画面综合起来,从中识别出每架飞机的实时位置和速度矢量,并将管制员当前指挥的飞机画面显示在管理界面中。该网络还对跑道周围的状况提供警戒,预防跑道侵入事件的发生。

3、综合管理界面。上述语音和视频内容统一显示在塔台的中控大屏上,与管制需要的其他信息结合,减少管制员低头、跨屏等复杂操作的频率,更好地集中注意力。

在分享直播中演示了整套系统的具体操作流程:管制员向飞机发出指令,系统自动将指令语音转换为结构化指令传送给目标飞机,并联动监控视频画面开始跟踪飞机动作,实时显示飞机位置与速度数据。当飞机准备进入跑道时,系统会提前检查跑道状况,预警入侵事件。飞机进入跑道后,系统自动联动中控台开启跑道入口警示灯,防止其他飞机进入跑道。

智能塔台主要解决了传统空管模式中“看”与“防”的两大痛点:智能视频监控提供飞机目标的识别、定位和动态显示,为管制员提供数字化的“自动望远镜”,追踪监控飞机的运行状况;跑道入侵预防系统则通过综合轨迹比对、场景提升和事故防范规则等预防跑道争抢,并在出现危险时及时发出灯光和信息警报,实践中,该系统可以显著提升塔台效率,降低地面事故风险,效果得到了客户的好评。


华为云 ModelArts+HiLens:快速开发成熟的机场智能视频网络


在项目早期阶段,麦图首先自行开发了语音识别和指令控制功能,解决了智能塔台系统的第一部分需求。而在面对第二部分的重头戏:AI 视频监控网络时,麦图团队意识到从零开始创建 In-house 方案是不现实的,无论是成本还是时间投入都超过了团队能力范围。面对“钱少事多时间紧”的现实约束,麦图开始着手寻找成熟的第三方基础设施。


经过分析对比,麦图最终选定了华为云 ModelArts+HiLens 云边一体的视觉 AI 开发平台。之所以选择华为云平台,麦图提到了技术选型中麦图看重的几大要点:


  • 生态支持。华为云 ModelArts+HiLens 有着比较完善的社区生态,可以满足麦图更多类型的需求。

  • 降低基建投入。一站式 AI 开发者平台 ModelArts 可以提供标注、训练、部署、运行的一整套生产流程,降低了麦图开发过程中需要的资源投入。

  • 快速开发迭代。在华为云平台完善的功能支持下,麦图最快可以做到 6 小时迭代一个新版本,极大提升了响应能力。

  • 成果投产可延续。华为云平台可以确保实验室方案能够顺利迁移到生产环境,避免冲突和回炉。

  • 供应链稳定可靠。作为国内领先的 AI 云服务提供商,华为云能够为麦图带来长期可靠的供应链保障。


在华为云 ModelArts+HiLens 平台中,核心组件之一就是一个小巧的黑盒子:HiLensKit。该设备集成了性能强大的华为 NPU,能够提供高算力的边缘侧 AI 推理能力,同时设备上自带的摄像头可以满足常见场景的监控需求。麦图团队首先使用 HiLens Kit 自带的摄像头开发出了演示产品,获得客户认可后继续开发了四路监控平台,每一部 HiLens Kit 设备连接四路视频信号进行 AI 分析,以降低生产环境中的部署成本。

华为云 ModelArts 主要提供模型的开发和部署平台,帮助麦图快速训练图像识别模型,并提供一站式的云端管理界面。系统端云一体的物理架构如下:

选定基础开发平台后,麦图根据企业级应用的核心——扩展——应用三层范式,将技术架构的全部内容归纳为三大类别。其中,核心部分是监控图像的采集和 AI 识别,扩展功能是根据识别出来的飞机图像进行坐标和轨迹处理,而应用部分则是结合底层数据开发中控平台。

智能视频监控开发实践:从原型开发到优化改进


确定了技术架构后,麦图团队就开始着手开发第一部分的视频 AI 识别模块。这一模块的技术需求是“稳、准、快”,即图像识别框可以稳定套在目标飞机上;多路视频并行识别,并使用仿雷达算法精确定位飞机运动轨迹;保证一秒 20 帧的目标检测频率。根据这样的要求,麦图首先使用 Python 开发了一个原型方案,实现了基本的功能与特性。

但 Python 方案的性能较低,无法满足生产环境需求。为提升方案速度,麦图开始寻找基于 C++ 代码的设计。由于麦图缺乏 C++ 的实践开发经验,因此将目光投向了华为云社区,并在华为云 HiLens 平台的技能市场上找到了一个成熟的多路识别程序。经过简单修改,麦图就以此为基础实现了一个 C++ 的识别模块。进一步,团队又通过将 API 改为 Socket 接口、减小采集图片大小的方式来降低单帧处理耗时,最终实现了每秒 20 帧的输出目标。


为确保图像识别结果框与管理界面显示的监控画面稳定对齐,麦图选择由 Kafka 来传输非图片数据、Redis 键值对保存视频帧,从而分担数据处理压力,实现精确对齐。为了获取目标飞机的精确运动轨迹,麦图开发了 2D->3D 的转换算法,利用摄像头内收集的畸变等数据与场内参考数据辅助实现 2D 画面到 3D 航迹的转换。此外,麦图的仿雷达算法可以通过跨摄像头联动来追踪飞机的连续运动轨迹,而卡尔曼滤波和匈牙利算法则可实现单摄像头多目标的识别能力。


在整个开发过程中,HiLens 平台的技能市场与便捷的云端操作界面给了团队很大的便利。开发人员只需简单几步操作即可转换 pb 模型到 om 模型,下载、配置和部署技能,可以随时根据需求和反馈快速调整现有设计。整个项目的第一版模型开发仅仅用时三天,快速完成了标定、训练的全过程,华为云 ModelArts+HiLens 功不可没。

云端赋能航空业数字化转型:华为云的实践与成就


麦图的智能塔台 AI 实践只是华为云解决方案赋能航空业的一个侧影。在智慧塔台领域之外,华为云还与瑞丽航空、深圳机场、迪拜机场等客户合作,开发了机场私有业务云、智慧一体化平台、模块化数据中心等创新方案,进而达成了旅客人脸识别登机、自助托运、自动化航班机位分配、智能主动安防体系等成果。通过 AI、IoT、大数据、融合通信等技术,华为云与客户携手实现业务协同与敏捷创新,打造出智慧机场的数字世界底座。2019 年,中国民航局还与华为云签署战略合作协议,就智慧民航顶层设计、智慧民航建设、科技创新与成果应用示范、标准制定、人才培养与合作交流等领域展开合作,共同推进智慧民航建设,践行民航强国战略。


从智能塔台到智慧机场,华为云在航空业数字化转型趋势中正在扮演着越来越重要的角色。可以预期,未来会有越来越多像麦图这样的合作伙伴携手华为云,凭借不同层面的解决方案帮助机场、航司提升生产力和安全性,为航空业的未来贡献一份力量。

2020 年 11 月 20 日 14:381214

评论

发布
暂无评论
发现更多内容

去掉美颜和滤镜后的数字货币

亨利笔记

比特币 区块链 数字货币 DCEP libra

在今天种下一棵树

陈医僧Ethan

感悟 育儿

macOS 查看文件内容常用的命令小结

iHTC

我的编程之路-1(启蒙)

顿晓

编程 入门 启蒙 经历 故事

信仰

小天同学

人生 个人成长 思考 读书感悟 信仰

基于vue(element ui) + ssm + shiro 的权限框架

吴邪

程序员的macOS系列:精选Mac App

iHTC

程序员的macOS系列:Mac开发环境配置

iHTC

新人工作的时候遇到问题怎么办

波波

学习 编程 职场 新人

开张咯~

李绍俊

生活 随想

开通InfoQ写作平台测试

ytl

python面向对象的魔法方法详解

半面人

Python

从每个Python文件快速得到项目根目录的绝对路径

良少

Python 路径 绿色

技术人赚钱的9个路线

品牌运营|陆晓明

副业 赚钱 技术人 码农 生财有术

Hello World !

ATGU:阿宝哥

Java Hello World ! Info

年轻人的世界

boyzcl

年轻人 系列

能够实现的想法才有价值

伯薇

创业 创意 点子 商业价值

创业的使命是什么

Neco.W

创业 重新理解创业

赚钱的6个层次

品牌运营|陆晓明

创业 技术人 赚钱思维 层次 商机

系统的伸缩性以及扩展性设计

Janenesome

读书笔记 程序员 架构

关于沟通成本的一些认知

大鱼读书

项目管理 软件开发

关于「后浪」,ta 们在说什么?

boyzcl

年轻人 系列 后浪

程序员的macOS系列:高效Alfred进阶

iHTC

在InfoQ上开博的第一天

罗琦

开博 文章链接

[读书随笔]从哲学上的问题分类看TDD

老狗

哲学 TDD

我也曾对架构师的力量一无所知

曲水流觞TechRill

LeetCode 1396. Design Underground System

liu_liu

LeetCode

详解iOS性能优化,安装包瘦身

Usama Bin Laden

ios 源码分析 性能优化 性能 原理

关于CodeReview的一些思考

Yezhiwei

UITableView 手势延迟导致subview无法完成两次绘制

AlienJunX

Redis源码之常用数据结构和函数

心平气和

redis

6小时模型迭代的背后故事:华为云ModelArts+HiLens在空管领域怎么用?-InfoQ