QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

非 Transformer 架构大模型公司岩芯数智 RockAl 走通类脑机制:端侧 AI 也可以很智能|WAIC 专题报道

  • 2024-07-05
    北京
  • 本文字数:1998 字

    阅读完需:约 7 分钟

大小:1017.08K时长:05:47
非Transformer架构大模型公司岩芯数智RockAl走通类脑机制:端侧AI也可以很智能|WAIC专题报道

7 月 4 日-7 月 7 日,2024 世界人工智能大会(WAIC)在上海举行,来自国内外的数百款大模型集体亮相,呈现了 AI 大模型智能涌现、赋能千行百业的生动场景。在各色技术及应用的创新体验区中,一个具备高度交互能力的多模态机器人引起了人们的注意。


它就是来自岩芯数智 RockAI,搭载了树莓派 5 代芯片的“小智”,在极低算力的设备上实现了强大的多模态能力。



继年初推出超强性能的 Yan1.0 云端大模型后,RockAI 再次突破了端侧 AI“原生无损”门槛,并在这款机器人上部署了此次首发的 Yan 1.2 大模型。


与传统的自动控制机器人不同,小智具备多模态认知能力,能够基于 Yan 1.2 的语音和视觉处理能力,准确理解用户的模糊指令和意图,并据此控制其机械躯体完成各类复杂任务。随着这款智能机器人在各种模糊指令下描述“视觉”场景、展现“四步成诗”,一场关于端侧 AI 的全新想象也铺展开来。


端侧 AI 打响突围赛

端侧 AI 通常指在终端设备上直接运行和处理人工智能算法的技术,其优势在于可以直接利用设备的计算能力进行数据处理,不需要将数据发送到云端或服务器进行处理,从而降低对云端计算资源的依赖。且无论网络环境如何都能即时生成响应,确保用户数据安全性的同时,减少了相关算力成本开支。


自去年下半年以来,随着大模型的竞争从技术驱动过渡到市场驱动,端侧 AI 以其广泛的应用场景备受青睐,开始释放出全新的发展价值。全球范围内各大模型厂商纷纷通过各种技术手段,尝试将大模型在物理意义上融入终端。


但受制于端侧 AI 落地的算力和功耗等挑战,传统轻量化部署往往均以性能损失为代价。如目前大热的 AIPC 是把 Transformer 架构的模型通过量化压缩部署到个人电脑,仅 70 亿参数的大模型还需要额外定制 PC 芯片为其提供算力。而此前在微型电脑主板树莓派 5 上打出“1.89tokens 每秒速度运行、支持 8K 上下文窗口”战绩的 Llama3 8B,同样止步于“有损压缩”。压缩后的模型不仅性能大打折扣,还会失去再训练、再学习的能力,成为无法定时更新底层知识的“一次性 AI”。

基于仿生神经元驱动的选择算法,Yan 1.2 更专注于端侧设备

RockAI 此次首发的 Yan 1.2 大模型,可以“原生无损”地以 6+tokens/s 的速度运行于算力仅普通电脑八分之一的树莓派上,并在这个仅有信用卡大小的芯片上实现超强的多模态能力,不仅能“听说读”,还可以识别模糊指令,进行学习、创作及互动。


这一成果,起初是得益于对于大模型基础架构的“破坏式”创新。早在今年 1 月,RockAI 发布了国内首个非 Transformer 的 Yan 架构大模型。该架构通过对 Attention 机制的替换,将计算复杂度降为线性,大幅降低了对算力的需求,用百亿级参数达成千亿参数大模型的性能效果,并且率先实现了在主流消费级 CPU 等端侧设备上的原生无损运行。


为了实现树莓派等更多更低端设备的无损适配,RockAI 基于全新自研的 Yan 架构,在实验室对人工神经网络最底层的反向传播算法进行挑战,寻找反向传播的更优解尝试,进一步实现 Yan 模型的降本增效。同时在算法侧,RockAI 采用了基于仿生神经元驱动的选择算法,实现了类脑分区激活的工作机制,使大模型可以根据学习的类型和知识的范围分区激活,大幅减少了数据训练量,同时也能有效发挥多模态的潜力。故而,模型迭代到 1.2 版本,已经可以实现在 PC 端、手机端、树莓派端和机器人端等设备上的无损运行。

“同步学习”打造设备端“最强大脑”


历经了卷参数、卷市场的阶段,大模型当下正集中于一个“卷智能”的时代,因此,让大模型无损跑通更多低算力设备只是第一步,接下来就要思考如何提高端侧大模型的知识密度、智能密度。但 RockAI CEO 刘凡平还有一个更高的目标,就是在实现通用人工智能的同时,将 AI 与每个人独特的地方结合在一起,模型具备自主学习能力,让每个设备都拥有个性化的智能。


为了实现这种个性化的通用人工智能,RockAI 团队首创了“同步学习”理念,让模型具备像人一样实时学习的能力,在推理的同时进行知识更新和学习,无需像云端大模型一样“返厂”进行再次更新或预训练。从而实时、有效且持续性地提升大模型的智能密度,应对各类个性化场景中出现的问题。


基于神经网络的底层技术创新,RockAI 不断尝试寻找反向传播的更优解,试图能更低代价更新神经网络,实现对现有知识体系的快速更新,辅以模型分区激活降低功耗、实现部分更新,使大模型像人类学习一样建立自己独有的知识体系,实现模型的边跑边进化。会上,RockAI 展示了“同步学习”的实验室示例,并表示该机制已处于实验室最后验证阶段。


而对于 Yan 模型在设备端的落地,刘凡平则透露,团队正加紧进行设备端的适配工作,目前已与众多硬件和芯片厂商建立了沟通与合作。


RockAI 以 Yan 架构大模型为核心的技术突破与创新实践,标志着端侧 AI 正逐步克服技术壁垒,向更广泛的应用场景迈进。不仅是对现有计算范式的挑战与超越,更是对未来智慧生活的前瞻布局。

随着全模态支持+实时人机交互+同步学习的落地,Yan 2.0 或将重新定义设备的价值,成为设备的“最强大脑”,真正做到“让世界上每一台设备都拥有自己的智能”。


2024-07-05 00:315344
用户头像
李冬梅 加V:busulishang4668

发布了 1045 篇内容, 共 658.2 次阅读, 收获喜欢 1209 次。

关注

评论

发布
暂无评论
发现更多内容

普通二本,吃透这份阿里高级专家的《Java面试手册21版》成功拿下腾讯offer

Java架构师迁哥

如何看懂常用原理图符号、如何阅读原理图

不脱发的程序猿

电路设计 原理图符号 阅读原理图

为什么开发5年的同事,还在学习23种设计模式?是他太菜?

Java架构师迁哥

网络攻防学习笔记 Day39

穿过生命散发芬芳

网络攻防 6月日更

Linux Shell 自动交互人机交互的 3 种方法

学神来啦

Linux 运维 Shell 虚拟机 linux运维

Mybatis缓存机制详解

北游学Java

Java mybatis

揭秘Spring家族之——AOP和IOC

Java架构师迁哥

博客

vincentjia

入职美团定级P7,总结2021年最新180道高级岗面试题及答案

Java架构师迁哥

上新!H3C Magic NX54双频5400M Wi-Fi 6路由器:549元

科技热闻

京东T8Java架构师呕心沥血总结整理的《15w字的Java面试手册》免费开放分享给大家复习。

Java架构之路

Java 程序员 架构 面试 编程语言

解读革命性容器集群CCE Turbo:计算、网络、调度全方位加速

华为云开发者联盟

容器 华为云 CCE Turbo 集群服务器

AI缘起——达特茅斯会议

行者AI

人工智能

数仓发生数据倾斜不要慌,教你轻松获取表倾斜率

华为云开发者联盟

GaussDB MPP GaussDB(DWS) 数据倾斜 并行架构

Hanoi 塔问题(Java实现)

若尘

数据结构 java编程 6月日更

阿里云,让「服务」成为一种先进生产力

ToB行业头条

云计算 阿里云

公安警情研判分析系统搭建,警情可视化指挥调度

智能家居弱电布线设计注意事项

不脱发的程序猿

智能家居 弱点布线

老同学突然升到了阿里P7,只因偷偷掌握了JVM的奥秘?

Java架构师迁哥

2021版最新!字节跳动3面+腾讯6面一次过,谈谈我的大厂面经

Java架构之路

Java 程序员 架构 面试 编程语言

深度分享丨如何使用微细分仪打造金融场景下的战术级客户分群

索信达控股

大数据 金融科技 用户细分 客户数据平台 客户画像

视频监控系统供电方式及选择方法

不脱发的程序猿

视频监控系统 供电方式 智能监控

每日优鲜:AI 技术驱动下的社区新零售

蚂蚁集团移动开发平台 mPaaS

人工智能 算法 图像识别 codehub

java中的NIO和IO到底是什么区别?20个问题告诉你答案

华为云开发者联盟

Java io nio buffer channel

带你遨游银河系的十种分布式数据库

悟空聊架构

数据库 分布式 分布式数据库 6月日更

云图说|OLAP开源引擎的一匹黑马,MRS集群组件之ClickHouse

华为云开发者联盟

Clickhouse MRS 华为云 云图说 OLAP开源引擎

真香!SpringBoot+SpringCloud Alibaba全套脑图+学习笔记+大厂面试题

Java架构追梦

Java 架构 微服务 springboot SpringCloud

花了三个小时把一份GitHub上标星115k的《Java超全进阶教程》整理成了PDF文档。

Java架构之路

Java 程序员 架构 面试 编程语言

5.7w字?GitHub标星120K的Java面试知识点总结,真就物超所值了

Java 编程 程序员 面试 计算机

【译】JavaScript 代码整洁之道-重构篇

KooFE

JavaScript 大前端 代码重构 6月日更 整洁代码

学历不够,技术来凑,8年开发经验,逆袭拿到阿里P7岗

Java架构师迁哥

非Transformer架构大模型公司岩芯数智RockAl走通类脑机制:端侧AI也可以很智能|WAIC专题报道_生成式 AI_李冬梅_InfoQ精选文章