受访嘉宾 | 奚伟 美的中央研究院智能技术与应用研究所所长
智能化感知技术与人工智能的深度融合,推动了众多行业的技术革新和应用变革。在这一背景下,美的中央研究院以“AI+”战略为核心,通过在“AI+ 工业机器人”、“AI+ 智能制造”、“AI+ 智能家居”、“AI+ 医疗影像”四个主要方向的布局,力图通过技术创新,提升美的产品力和竞争力,服务于多元化经营的目标。
智能化感知技术是通过传感器和数据处理装置实现对环境、物体和人类行为的感知、识别和分析的技术手段。AI 则利用这些感知数据进行深度分析和决策,形成智能化的解决方案。
在美的中央研究院的“AI+”战略中,智能技术与应用研究所起到了至关重要的技术支撑作用。本文中,InfoQ 通过与美的中央研究院智能技术与应用研究所所长奚伟的交流,探讨了美的“AI+”战略布局及智能化感知技术应用的最新进展。
据介绍,美的通过开展新型传感器、多模态智能感控技术,以及具身智能大模型技术的研究,为下一代工业机器人,先进医疗影像设备,和未来家电等前沿方向提供关键核心感知部件支撑和差异化感知平台技术方案。这些技术不仅增强了产品的智能化水平,还为未来的应用场景奠定了坚实的基础。
同时,随着技术的快速发展,美的在推广和应用过程中也面临着诸多挑战,如技术的成本效益、市场竞争的压力以及人才的培养和团队的建设等。如何在这些挑战中找到平衡点,也是美的未来需要持续探索和解决的问题。
爆发期下的智能化感知技术:美的如何布局“AI+”战略
InfoQ:您能介绍一下美的中央研究院在“AI+”战略上的整体布局和目标吗?其中您所负责的“智能技术与应用”板块在其中是扮演什么样的角色?
奚伟:美的中央研究院目前主要在 “AI+ 工业机器人”“AI+ 智能制造”“AI+ 智能家居”“AI+ 医疗影像”四个主要方向展开布局。目标是通过 AI+ 的革命性技术创新实现美的产品力和竞争力的领先,服务美的多元化经营的目标。
智能技术与应用板块是美的“AI+”战略的重要技术支撑力量和新技术应用的先锋队。通过开展新型传感器、多模态智能感控技术,以及具身智能大模型技术的研究,为下一代工业机器人,先进医疗影像设备,和未来家电等前沿方向提供关键核心感知部件支撑和差异化感知平台技术方案。
比如,在关键传感器方面,我们研发了智能 3D 相机、一体化力觉传感器和一些精密编码器,以及毫米波雷达等一系列传感器,涵盖从空间感知到位置感知的各个领域。实现关键传感器,医用探测器核心部件自研自制。
在此基础上,我们重点研究核心算法,探索如何将这些传感器和探测器应用于机器人和医疗设备中进行研发,推动前瞻性感知技术跨事业部布局及产业应用。我们的最终目标是在工业、医疗领域、以及未来家电领域智能化感知行业实现产品创新和行业领先。
InfoQ:在推动 AI+ 战略方面,您的日常工作主要关于哪些方面?
奚伟:我的工作主要包括整体“AI+”和“三个一代”(研究一代、储备一代、开发一代)技术战略的规划和布局,“AI+”在新业务领域的探索及国际化、高水平团队的组建及能力建设,带领团队在核心技术上攻关,实现技术突破,并协同事业部积极推进技术应用转化。
InfoQ:从整体进展来看,智能化感知技术在机器人、医疗及智能家居领域的应用研究及技术创新,目前是什么样的现状?
奚伟:智能化感知技术在机器人、医疗及智能家居领域的应用研究及技术创新目前处于一个新的爆发期。
整体趋势是从自动化、精准化向智能化转变,目前也是全球各大公司投入大量资源,竞争差异化的重点。
以机器人为例,结合视觉及多元感知的具身智能技术的出现,改变了传统通过编程实现自动化的过程,机器人的技能通过学习完成,高质量训练数据成为核心。医疗领域也是如此,利用深度学习技术可提高扫描速度,减少 CT 的辐射剂量,基础大模型技术可以辅助报告生成和智能化诊疗。“AI”技术极大促进了传统技术的升级。
AI 和智能化感知技术的选择与发展策略
InfoQ:在技术的研发和应用过程中,美的如何确定哪些 AI 技术和智能化感知技术值得投资和开发?选择技术的逻辑和标准是什么?
奚伟:我们主要从 AI 技术相对传统技术的差异化优势和价值,以及行业技术发展趋势来进行技术布局和投资。如通过引入 AI 技术可以扩展产品的应用领域,或提升产品的关键指标,这些都是明显判断技术价值的标准。再比如对于机器人,通过 AI 技术进行智能制造,可以减少工人的劳动强度并提高制造效率,也是价值的体现。
如果技术成熟度不太高,市场不明确,但未来有重大前景的 AI 技术,我们也会提前布局。
InfoQ:有没有出现在技术投入过程中,我们最初判断某项技术符合需求并能带来商业价值,但经过一段时间的投资和研发后,发现方向不对的情况?
奚伟:这种情况也是会有的,但正如我刚才提到的,美的拥有一个较好的研发体系,可以最大程度地减少这种情况的发生。我们采用“研究一代、储备一代、开发一代”的模式。
每个阶段投入的资源是不同的。在前沿研究方面我们会选择一些我们认为有潜力的技术进行尝试,当可行性得到验证后才会进一步进行结合业务场景进行更详细的论证。这些系统性的技术管理保证了技术决策的合理性及延续性。
InfoQ:能否举个例子说明这种情况?
奚伟:比如毫米波雷达,虽然这个例子可能不是特别典型,但它确实展示了我们在技术判断过程中的一些经验。
在早期阶段,毫米波雷达是我们非常看好的方向,因为它可以提升智能家居的智能化程度。我们在前期投入了一些资源进行底层技术研发和关键传感器的开发。然而,随着时间推移,我们发现市场上的竞争非常激烈,很多供应商也在开发类似的技术,导致差异化程度降低。
最终,由于市场竞争充分,毫米波雷达的价格变得非常低。在这种情况下,我们认为继续自研这项技术的商业价值不大。就会调整技术方向,选择投入更多资源到其他更具技术附加值的领域,特别是那些需要攻关的技术方向。
InfoQ:那在领导技术团队进行攻关时,您认为最关键的因素是什么?团队素质最重要的点有哪些?
奚伟:这个问题比较大,但有几个关键点。
首先是热情。尽管我们做的是前沿技术,但很多时候是在摸着石头过河,没有现成的方法可以参考。我们需要阅读大量文献,做许多实验,并不断试错,才能找到相对可靠的解决方案。这对团队的耐心是个巨大挑战。
其次是结果导向。在国内,结果导向非常重要。我们需要在研发过程中能够阶段性地输出一些成果,以保持团队的信心。让大家看到我们一步一步取得进展,这样能促使团队坚持下去。
另外在管理团队方面,我认为首先是能力要强,找到有能力的领军专家,通过“老带新”,进行有效率的技术攻关;其次有共同的目标,把自己的工作看成是对社会发展有影响的事业;日常管理上,“三个一代”战略牵引,工作目标牵引。
InfoQ:从结果导向来看,这对您来说有哪些挑战?特别是很多前沿技术需要很长时间才能转化为实际成果。
奚伟:确实如此,前沿技术从研发到成果转化往往需要很长时间。我们需要展示技术的潜力,让领导层看到未来的投资价值。如果一项技术经过一段时间的研发,发现对产品能力和用户价值的提升不大,投资的动力就会逐渐减弱。
比如说,IoT 技术曾被寄予厚望,希望实现万物互联,提升智能家居的用户体验。但由于技术标准不一致和用户价值体现不够明显,渐渐地很多企业对 IoT 的投资逐渐减少。这提醒我们在技术研发过程中,需要确保技术的潜力和价值被充分展示和认可。
AI 驱动下的场景应用与产业创新
InfoQ:在“AI+ 工业机器人”方面,智能技术与应用研究所取得了哪些主要成果?这些技术突破是如何支撑产业转型升级并推动制造数字化转型?
奚伟:美的承建了蓝橙全国重点实验室,其中 AI+ 工业机器人是实验室四大建设内容之一。
技术方面,首先在底层传感器方面,我们在包括 3D 相机、力传感器、编码器、激光雷达和毫米波雷达等传感器都取得了显著进展。其次,在技术平台方面,搭建了工业视觉技术平台、低代码编程平台、智能导航平台以及数据仿真平台等。这些平台不仅能够迅速实现技术落地,还支撑了产品的升级。第三,通过仿真平台,也加速了模型的迭代和开发。
结合应用场景来看,也可以举几个例子:
针对工业制造应用场景接近 100% 识别成功率的需求,美的研发了基于视觉大模型的通用强泛化高精度识别定位的技术,应用于焊接,装配等 5 类典型制造场景,完成 100 余条产线规模化复制。
针对重载移动 AMR 的高鲁棒精准定位需求,美的研发了多源异构传感器的多模态融合智能定位技术及 AI 安全感知技术,也已应用于库卡 KMP 系列潜伏式 AGV 超过 1000 台套。
高速 3D 成像,应用于复杂场景下的动态制造,如涂胶和焊接等,通过计算机相机辅助智能制造。
针对重载机器人要达到应用低代码编程目标,美的研发图形化编程软件,大大缩短了机器人部署时间。
目前工业机器人典型场景完成了验证并实现了批量化落地应用,覆盖 80% 重载应用场景。
另外,美的结合生成式 AI 大模型,大数据,物联网,云计算等数字技术创新,把数字技术与制造业深度融合,建立了 28 家国家级绿色工厂、3 家零碳工厂、5 家世界级灯塔工厂,入选国家级双跨平台。其中电子车间的无人化场景是“AI+ 制造”智能化发展的重要方向之一。
InfoQ:在技术推广过程中,主要会遇到哪些阻力?
奚伟:推广过程中主要的阻力有以下几个方面:
现有产线改造的复杂性:在新的产线上推广相对容易,因为可以整体规划。然而,在已有产线上的改造涉及到很多方面的工作,包括人员对新技术的不了解和需要学习新知识等问题。
技术适应性和环境因素:传统制造依赖人的适应性,而机器在适应不同环境时要求更高。例如,环境的稳定性和光照等因素对机器的影响较大。很多技术在一个工厂研发完成后,扩展到其他产线并不像软件复制粘贴那么简单,需要进行很多微调和定制化。
人员培训和接受度:培训人员接受并拥抱智能化技术是一个很大的挑战。很多员工对熟悉的流程依赖较强,对新的智能化技术不熟悉,可能会感到困难,不愿意使用。
针对人员培训,库卡也推出了新匠星计划,目标是培养更多适应数字化、AI 时代的高级技术人才 。
InfoQ:针对“AI+ 智能家居”方向,智能技术与应用研究所在家电智能化和机器人化方面有哪些创新?
奚伟:智能家居是我们研究所的新方向。我们研究所主要面向 To B 方向,但在 To C 方向,尤其是“AI+ 智能家居”方面,未来智能家居将出现两个发展方向:
第一,家电主动服务,识别用户意图,学习用户习惯,为用户提供服务。
第二,家电机器人化,家电即机器人,比如说现有的扫地机器人,未来还会有更多的家电以机器人的形态出现。两个发展方向均需要突破 AI 技术。
目前,美的集团在语音语言、边端智能、AI 大模型等 AI 技术方向持续突破:
语音方面,打通了语音全链条上技术环节,已上线 5 个不同特色发音人并提供了稳定的 TTS 服务,低信噪比环境增强后语音识别率上升 15%,唯一唤醒成功率 90%。
边端智能方面,持续对模型压缩和推理加速优化,实现语音模型压缩比>7x, 推理时延降低 70%;视觉模型压缩比>16x, 推理时延降低 75%;美的发布国内首个家居领域 AI 大模型“美言”,为智能家居构建了智能感知、自然交互和自主决策三个基础能力。
在服务机器人方向,美的利用 AI 等技术研发服务机器人产品,美的集团获批建设“智能服务机器人国家新一代人工智能开放创新平台”。
在新的方向上,我们目前主要围绕着家电机器人化展开工作。我们现在有一些业务场景,大家相对接受度较高的是扫地机器人。除了扫地机器人,我们还在探索其他智能家居产品的可能性。
InfoQ:以扫地机器人为例,它在智能化方面,还有哪些潜在的想象空间?
奚伟:其实有几个方面可以考虑:
扫地能力提升:传统的扫地机器人只能进行基本的清扫工作。未来,我们希望它能智能识别不同的地面类型和污渍情况,进行更高效的清扫。这是一个重要的方向,我们在这方面也做了许多技术攻关。
语音交互:目前,扫地机器人有时会出现无法找到的问题。通过改进语音交互功能,用户可以更方便地与机器人进行沟通,例如让它自动找到某个地方进行清扫,而不需要手动操作手机或遥控器。
拓展清扫范围:现有的扫地机器人还无法触及某些地方。我们正在尝试让机器人清扫地脚线等区域,甚至结合拖洗一体机,扩展其功能和应用场景。
这些探索都可以进一步提升扫地机器人的智能化水平和用户体验。
InfoQ:现在大语言模型给许多行业带来了影响,无论是效率提升还是智能理解方面都有比较大的进展。能否再详细谈谈美的对美言大模型的期望和愿景?
奚伟:美言大模型的主要优势在于提升平台化的语义理解能力。传统的语音交互只能响应特定的关键词,而美言大模型可以理解用户的自然语言表达,从而提供更优质的服务。这对现有家电来说是质的飞跃。
通过结合美言大模型,我们可以将其应用于烤箱、微波炉等家电产品,提升它们在烹饪和清洁方面的智能化水平。模型的生态系统能积累大量用户数据,进而不断优化模型,增强产品功能和用户体验。通过这种持续的改进,产品的用户复购意愿也会提高。
核心在于,传统的 To C 产品在销售后基本不会再有大的升级变化,而借助大模型技术,产品将具备自学习能力。它们可以根据用户习惯调整操作方式,例如提供更节能的模式,或在烹饪过程中提供智能化提示。对于老人用户,系统可以在忘记关火或操作失误时主动提示和纠错。
总体而言,美言大模型将实现家电的主动服务和家电机器人化,不仅理解用户需求,还能进行智能操作。
InfoQ:在“AI + 医疗影像”领域,智能技术与应用研究所如何通过 AI 技术提升医疗资源的整合和优化?这些技术对医疗影像诊断和治疗流程有什么影响?
奚伟:在“AI+ 医疗影像”方面,人工智能将加快医疗领域的资源整合优化,用 AI 技术赋能诊疗一体化全流程,实现一体化精准诊疗新技术、及跨科室、多模态、数智化的诊疗新方案。
目前美的开发的昆仑 AI 智慧影像平台,通过将 AI 深度嵌入临床影像工作流程,改善扫描流程,提升成像质量,辅助医生进行诊断、治疗决策等,进而打通筛诊疗预随全临床流程。
同时覆盖多病种 AI 解决方案,精准高效触达更多临床场景。比如,AI 自动定位及自动扫描覆盖 60% 临床部位,效率提升 30%;AI 静音技术降低 86% 的噪声声压,改善医患检查舒适度;AI 去噪加速功能,实现 4 倍加速的同时图像信噪比提高 30%;妙笔 AI 质控软件,除了全天候自动检测影像报告外,更进一步提供报告质控应用,智能提醒医生报告书写错漏,正确识别准确率高达 93%,提高各级医疗机构医生报告质量,大大降低因书写错误造成的纠纷。
InfoQ:美的智能家居有一个美言大模型,那在医疗领域,会不会也有一个垂直领域的大模型?
奚伟:是的,我们确实有这个计划,目前还在进行当中。我们正在组建团队,进行相关的布局。
InfoQ:医疗领域的大模型有应用于科研、药物研发等不同领域的,而美的会更侧重于智能诊断和设备方面?
奚伟:对,美的主要在智能诊断和设备方面进行布局。万东医疗有一个云平台,可以将医院产生的数据上传,帮助生成病理报告。此外,我们希望通过大模型技术在设备端自动生成术后的扫描报告,辅助医生进行后续诊断。我们在这些方面都在进行布局。
智能化技术挑战与应对策略
InfoQ:在推动数智化技术产业化落地的过程中,遇到过哪些主要挑战?您是如何应对这些挑战的?
奚伟:最大的挑战有两个,一个是技术的预期和现实的差距,一个是高质量数据资源不足。第一个问题最难解决,通过客户希望智能化技术能像人一样的灵活度,但实际情况是目前智能化技术仅能实现有限场景的智能化。随着 LLM 大模型技术和 AGI 技术的不断发展,我认为这一个差距会逐渐缩小。
对于数据稀缺问题我们积极采用数据仿真合成的方式进行补足。另外,高端前沿人才还较为缺乏,总体来说,AI 人才相对欠缺,传统人才更多一些。
InfoQ:根据您的经验,您认为哪些因素最能决定 AI 技术和智能化感知技术的成功落地?
奚伟:有几个主要因素。首先是技术应用的成熟度,这是最关键的因素。很多智能化技术无法落地,主要还是因为技术还不够成熟。第二个因素是找到产品价值、对于用户的价值。第三是新技术培育的土壤和成本控制,早期必须要有正向的收益来推动技术的不断迭代,但在中国的环境中,这很难实现。很多技术还没推广,就已经降到了“地板价”。
InfoQ:最后想问下在美的集团的“AI+”战略下, 智能技术与应用研究所下一步有哪些规划和目标?
奚伟:总体来说,我们会围绕美的产业布局不断深化扩展“AI+”场景应用,形成真正的新质生产力。另外还会探索未来新赛道、探索场景新应用。
也计划将更多传感器、毫米波激光雷达等技术植入机器,让工业机器人、医疗设备、智能家居拥有智能大脑和眼睛,从而提升用户体验。
嘉宾介绍
奚伟,高端重载机器人全国重点实验室副主任,国家级科技创新领军人才,美国马里兰大学帕克分校博士,本硕毕业于清华大学。目前担任美的中央研究院智能技术与应用研究所所长,主导集团内部多个数智化技术研发和产业化落地项目,推动集团在“AI+”战略上技术布局和创新。项目内容涉及 AI 工业视觉算法研发及低代码免编程技术在智能制造应用,多模态 SLAM 导航及视觉安全感知技术, AI 智能化医疗影像平台技术研发,未来智能家居场景下家电机器人化技术研究,下一代机器人及医疗设备关键传感技术研究等。
活动推荐
AICon 全球人工智能开发与应用大会将于 8 月 18 日至 19 日在上海举办,汇聚顶尖企业专家,深入端侧 AI、大模型训练、安全实践、RAG 应用、多模态创新等前沿话题。现在大会已开始正式报名,6 月 30 日前可以享受 8 折优惠,单张门票节省 960 元(原价 4800 元),详情可联系票务经理 13269078023 咨询。
公众号推荐:
AGI 概念引发热议。那么 AGI 究竟是什么?技术架构来看又包括哪些?AI Agent 如何助力人工智能走向 AGI 时代?现阶段营销、金融、教育、零售、企服等行业场景下,AGI应用程度如何?有哪些典型应用案例了吗?以上问题的回答尽在《中国AGI市场发展研究报告 2024》,欢迎大家扫码关注「AI前线」公众号,回复「AGI」领取。
评论 1 条评论