QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

国产大模型超越 Llama3!岩芯数智 RockAI 重新定义端侧智能

RockAI

  • 2024-08-20
    北京
  • 本文字数:1233 字

    阅读完需:约 4 分钟

大小:636.76K时长:03:37
国产大模型超越Llama3!岩芯数智RockAI重新定义端侧智能

8 月 18-19 日,AICon 全球人工智能开发与应用大会在上海举办,以“智能未来,探索 AI 无限可能”为主题,聚焦大模型开发与应用领域。RockAI CEO 刘凡平应邀出席并发表《非 Transformer 架构的端侧大模型创新研究与应用》主题演讲,重新定义端侧智能,引发了行业对端侧 AI 落地方向的全新思考。

 

众所周知,端侧 AI 通常指在终端设备上直接运行和处理人工智能算法的技术,具有减少云端算力依赖、保证用户数据安全等优势。目前,行业普遍将算力限制和数据匮乏视同端侧 AI 技术发展的拦路虎。而 RockAI 则认为,基础架构和核心算法的创新才是突破端侧 AI 发展局限的关键。基于对算法和架构的创新,即使面临算力限制,端侧 AI 仍可在终端设备上实现流畅的智能多模态运用。

 

这一观点也在 RockAI 关于 Yan 架构大模型的创新实践上得到了证明。其推出的国内首个非 Attention 机制的 Yan 架构大模型,可在主流消费级 CPU 等端侧设备上无损运行,达到其他模型 GPU 上的运行效果。全面升级后,Yan1.2 多模态大模型,已经可以在树莓派、机器人、手机等低功耗计算平台无损流畅运行,将端侧应用场景拓宽至智能家居、物联网等领域。而最新数据显示,3B 参数的 Yan1.3 preview 大模型在各项测评中的平均得分甚至超越了 8B 参数的 Llama3,达到极高的知识密度。



论坛现场,刘凡平深入剖析了当前端侧 AI 技术的发展现状及局限性。他指出,目前大多数“狭义端侧模型”的核心目标在于为用户提供大语言模型推理服务,受限于模型参数、算力、软件生态、功耗控制等诸多难题,往往会通过压缩、分割等软硬件协同优化实现大语言模型在终端设备上的本地化应用。但端侧 AI 的未来不仅仅在于推理能力的提升,更在于能够实现模型的自我学习和优化,以适应不断变化的应用场景和愈发广阔的用户需求。而通过以上处理手段,模型是无法在端侧进行训练和微调的,更不必说实现自我学习。

 

刘凡平强调,RockAI 不做“狭义的端侧模型”,而是着眼于更广泛意义上的端侧智能,即让世界上每一台设备都拥有自己的智能。这要求端侧模型除了语言理解及生成能力外,还应该具备抽象思考、因果推理、自我反思以及跨领域迁移学习等更复杂的认知功能。因此,端侧模型需要至少支持“理解表达、选择遗忘、持续学习”三种基础能力。

 

为达成这一目标,RockAI 在基础架构创新和实现消费级终端无损部署外,首创了“同步学习”机制。该机制可以使大模型在推理的同时进行知识更新和学习,建立自己独有的知识体系,实现模型的边跑边进化。同时,通过跨模态关联学习,增强模型在多场景下的应用能力,实现秒级实时反馈的人机交互,真正做到端侧模型的自我学习、类人感知和实时交互,推动端侧 AI 向自适应智能进化阶段演进。

 

RockAI 基于 Yan 架构大模型的技术突破和创新实践,打破了当前端侧 AI 发展的技术壁垒,不仅为整个行业的发展提供了新的思路和方向,也预示着端侧 AI 正朝着更广泛的应用场景稳步前进。待同步学习+全模态+实时人机交互落地后,Yan2.0 的诞生将重新定义端侧智能,真正赋予机器自主学习与自我优化能力,构建持续进化乃至群体智能涌现的 AGI 智慧生态。

2024-08-20 17:029020

评论

发布
暂无评论
发现更多内容

作业

Doctor Blind

架构实战营

apipost使用脚本发送一个接口请求

与风逐梦

后端 开发工具 接口测试

面试侃集合之SynchronousQueue非公平模式篇

码农参上

非公平锁 SynchronousQueue 8月日更

架构实战课程 模块一作业

Frank

linux笔记:极简方式安装mysql,建议收藏

小鲍侃java

8月日更

Pulsar 周报 2021-08-09 ~ 2021-08-15

Apache Pulsar

Apache Pulsar StreamNative

一文为你介绍ServiceComb Service-Center三大高性能优化点

华为云开发者联盟

开源 微服务 注册中心 Service-Center

新生代农民工的十八般武艺,你都了解吗

华为云开发者联盟

DevOps 云原生 编程语言 编程规范 新生代农民工

带你读AI论文丨LaneNet基于实体分割的端到端车道线检测

华为云开发者联盟

端到端 网络模型 车道线 实体分割 LanNet

Go- map的使用

HelloBug

Go 语言 map的使用

架构实战营-模块一作业

Alex.Wu

模块一作业

Geek_85eb5f

0基础架构入门 - 1(架构概述)

felix

架构实战营 0基础架构入门

云小课|想实现资源全自动备份?看完这篇秘籍,不再蕉绿~

华为云开发者联盟

云备份 自动备份 备份策略

Go- map的定义

HelloBug

Go 语言 map的定义

TP6+layui2.6.8开发的管理系统(FunAdmin),内置Curd命令模式 在线更新

funadmin

CMS layui 商城 管理系统 funadmin

常见内存泄漏引起原因

金陵老街

eKuiper 联手 OpenYurt,解决物联网场景下边缘流数据处理难题

EMQ映云科技

云计算 阿里云 物联网 IoT #Kubernetes#

架构实战☞ 微信业务架构&学生管理系统架构设计

眼镜盒子

架构实战营

微信朋友圈高性能复杂度分析

刘琦Logan

模块一

Tim

架构实战营

深入虚拟机探索Thread start

4ye

源码 线程 后端 JVM 8月日更

Vue进阶(七十二):css 样式中 逗号、空格、冒号、点号、~、>的区别

No Silver Bullet

Vue 8月日更

故事篇:数据库架构演变之路

阿Q说代码

主从复制 读写分离 集群部署 8月日更 垂直拆分

Spark必读!总有一些Spark知识点你需要知道

Qunar技术沙龙

spark hdfs mapreduce Web UI 数据倾斜

微服务的痛:用实际经历告诉你它有多坑(三)

我爱娃哈哈😍

微服务 架构设计

架构实战训练营模块 1 作业

斯蒂芬.赵

架构实战营

架构实战营模块一作业

李焕之

拆分电商系统为微服务

tjudream

微服务 电商 拆分

深层剖析鸿蒙轻内核M核的动态内存如何支持多段非连续性内存

华为云开发者联盟

鸿蒙 内存 结构体 OpenHarmony 动态内容

【墨天轮专访第二期】巨杉数据库萧少聪:重视企业长期需求,打造中国的世界级产品

墨天轮

数据库 人物访谈 国产数据库 巨杉数据库

国产大模型超越Llama3!岩芯数智RockAI重新定义端侧智能_AI&大模型_InfoQ精选文章