写点什么

独家|腾讯杰出科学家、混元大模型技术负责人之一刘威离职

  • 2024-11-19
    北京
  • 本文字数:1521 字

    阅读完需:约 5 分钟

大小:796.44K时长:04:31
独家|腾讯杰出科学家、混元大模型技术负责人之一刘威离职

AI 前线独家获悉,腾讯杰出科学家、腾讯混元大模型技术负责人之一刘威,目前已经从腾讯离职。


今年 5 月,刘威以混元大模型技术负责人之一的身份,出席 InfoQ 举办的 AICon 全球人工智能开发与应用大会并发表了《腾讯混元大模型技术和应用实践》的主题演讲。今年 9 月,他还在 2024 外滩新媒体年会上发表了题为《生成式 AI 的发展与腾讯混元大模型的实践》的主旨演讲。


刘威于 2012 年获得美国哥伦比亚大学计算机科学与电子工程博士学位,曾任 IBM 沃森研究中心研究科学家。刘威博士长期从事计算机视觉、机器学习、数据挖掘、信息检索等领域的基础研究和产品开发,迄今发表和录用论文 100+ 篇,总引用次数近 5 万次。


刘威曾先后获得 2011 年底 Facebook 博士研究生奖学金、2013 年度哥伦比亚大学优秀博士论文奖、2014 年度计算机视觉与模式识别国际会议 (CVPR) 青年研究者奖、2016 年度国际信息检索大会 (SIGIR) 最优论文荣誉奖。


刘威多次担任国际权威期刊的客座编委与审稿人,自 2007 年起一直担任国际顶级会议 NIPS、CVPR、ICCV 等的程序委员成员,担任第四届自然语言处理与汉语计算会议 NLPCC 2015 的领域主席,并自 2014 年起担任美国自然科学基金信息与智能系统分部 (NSF IIS Division) 的研究项目评审。


2017 年 3 月,刘威从 NSF IIS Division 离职,加盟腾讯 AI Lab,担任 AI Lab 计算机视觉中心总监、广告多媒体 AI 中心总监,负责图像视频数据相关的 AI 研究。


2022 年 11 月,刘威入选 2023 IEEE Fellow,入选理由是对大规模机器学习和智能多媒体的贡献。IEEE Fellow 是 IEEE 授予成员的最高荣誉,每年由同行专家在做出突出贡献的会员中评选出,当选人数不超过 IEEE 会员总人数的 0.1%。


刘威曾对外介绍,腾讯混元大模型名称的由来,表示“混元”在古代汉语中意味着从无序到有序、从混乱到规律的过程,这也正是生成模型的使命。


去年 9 月,腾讯混元大模型上线,之后腾讯又发布了混元大模型 MoE,目前已经涵盖了轻量版到中版,并且轻量版在腾讯云上完全免费。今年 5 月,腾讯混元文生图大模型发布,并宣布开源;到了 9 月,腾讯宣布推出新一代大模型“混元 Turbo”。


腾讯混元积累了大量自研技术,包括创新的专家路由 Routing 算法、独创的 MoE Scaling Law 机制以及合成数据技术,实现模型总体性能相比上一代 Dense 模型提升 50%,在文生图方面,混元实现了基于 LLM + DiT 的生成能力;视频生成上,腾讯混元拥有文生视频、图生视频、图文生视频、视频生视频等多种能力,支持 1k~4k 的分辨率。


“有人问腾讯为何如此拥抱生成式 AI?我认为软件的未来就是生成式 AI。”刘威曾在公开演讲中表示。据悉,目前混元大模型已接入腾讯内部 700 多个司内业务应用及场景,有很多是轻量模型,如微信输入法、微信“搜一搜”、腾讯新闻、腾讯会议、企业微信等。


在推理方面,刘威认为,如果一个 AI 无法推理,人类可以写一个很长的 Prompt 告诉它如何推理,但几年后 ChatBot 可能就不再有用了。因此,AI 的推理能力必须从被动推理变为主动推理。


在刘威看来,大模型越来越大的原因是人们希望无论是多模态、单模态、听说读写还是具身智能,它做越来越多的任务。由于整个方法论范式的改变,从单任务变成了多任务、从单模态变成多模态,多网络变成了一个大网络,这便是系统性的革新。生成式 AI 的系统性变革至少包含三个维度,即方法论的变革、运算模式的变革和算力的变革。


会议推荐


就在 12 月 13 日 -14 日,AICon 将汇聚 70+ 位 AI 及技术领域的专家,深入探讨大模型与推理、AI Agent、多模态、具身智能等前沿话题。此外,还有丰富的圆桌论坛、以及展区活动,满足你对大模型实践的好奇与想象。现在正值 9 折倒计时,名额有限,快扫码咨询了解详情,别错过这次绝佳的学习与交流机会!



2024-11-19 18:0012128

评论

发布
暂无评论
发现更多内容

区块链系统开发应用解决方案|去中心化应用dapp模式搭建

V\TG【ch3nguang】

异常检测:探索数据深层次背后的奥秘《上篇》

汀丶人工智能

数据挖掘 机器学习 异常检测

五项大奖、三项评估!为行业数字化转型发展注智赋能!

天翼云开发者社区

云计算 云服务

GLTF编辑器:在线模型材质编辑工具

3D建模设计

纹理处理 GLTF 材质修改

OmniFocus 3 for Mac(GTD时间管理工具) v3.15中文激活版

mac

任务管理软件 苹果mac Windows软件 OmniFocus Standard

GitHub上标星23K+的Redis进阶笔记(应用+原理+集群+拓展+源码)

小小怪下士

Java redis 程序员 java面试

软件定义汽车时代,1 亿行代码的安全保障,极狐GitLab 这么做!

极狐GitLab

gitlab 安全 DevSecOps 汽车 安全左移

Java基础面试题 【二】JUC

派大星

Java 面试题

行于“云”上,“翼”路顺畅!

天翼云开发者社区

云计算 云服务

袋鼠云产品功能更新报告07期|智能、高效、安全,一个都不能少!

袋鼠云数栈

大数据 数据中台 产品更新

Mac电脑版MarkDown写作推荐 iA Writer 激活中文最新版

胖墩儿不胖y

markdown Mac软件 Markdown 编辑器 写作软件

如何在不同服务器之间来进行安全又极速的大量数据同步?

镭速

REST API设计原则:构建可扩展、易维护的 API

高端章鱼哥

RESTful API REST API

基于Java开发的数字化询价招标采购系统(SRM系统源码)

金陵老街

spring-boot

私有云的优缺点是什么?与公有云的区别

青椒云云电脑

云桌面

护航政务“云上安全”,天翼云打造自主可控政务云能力体系!

天翼云开发者社区

云计算 网络安全 云服务

基于Java开发的neo4j知识图谱、elasticsearch全文检索的数字知识库

金陵老街

GLTF编辑器的另一个作用:格式转换

3D建模设计

格式转换 GLTF glb

FTP加速小技巧 | 这个工具居然能百倍加速FTP?

镭速

ftp ftp传输 ftp加速

成功入选 2023 谷歌出海创业加速器,Tapdata 乘势远航

tapdata

数据采集 数据集成 Tapdata

软件物料清单管理平台,让开源组件安全问题无所遁形

网安云

BIM对电脑配置要求高 云电脑了解一下

青椒云云电脑

云电脑

什么是模型混合模式?

3D建模设计

3D模型 gltf编辑器

视频转码工具 Compressor激活中文最新版

mac大玩家j

Mac软件 视频处理工具 视频编辑软件 编辑视频

国泰君安期货新一代国产业务系统上线 首次使用国产分布式数据库TDSQL

Geek_2d6073

百度智能云千帆大模型平台 2.0 产品技术解析

Baidu AICLOUD

异构计算 百度百舸 千帆大模型平台

百度APP iOS端包体积50M优化实践(六)无用方法清理

百度Geek说

ios 百度app 企业号9月PK榜

云桌面如何助力校园云办公 老师这么说

青椒云云电脑

云桌面

TDengine 用户案例合集 | 智能环保项目的时序数据处理难点与优化实践

TDengine

时序数据库 #TDengine

如何使用ChatGPT构建一个Web应用程序?

互联网工科生

应用程序 ChatGPT AI编程

华为云CodeArts Check代码检查服务用户声音反馈集锦(7)

华为云PaaS服务小智

云计算 软件开发 华为云 代码检查

独家|腾讯杰出科学家、混元大模型技术负责人之一刘威离职_腾讯_蔡芳芳_InfoQ精选文章