写点什么

独家|腾讯杰出科学家、混元大模型技术负责人之一刘威离职

  • 2024-11-19
    北京
  • 本文字数:1521 字

    阅读完需:约 5 分钟

大小:796.44K时长:04:31
独家|腾讯杰出科学家、混元大模型技术负责人之一刘威离职

AI 前线独家获悉,腾讯杰出科学家、腾讯混元大模型技术负责人之一刘威,目前已经从腾讯离职。


今年 5 月,刘威以混元大模型技术负责人之一的身份,出席 InfoQ 举办的 AICon 全球人工智能开发与应用大会并发表了《腾讯混元大模型技术和应用实践》的主题演讲。今年 9 月,他还在 2024 外滩新媒体年会上发表了题为《生成式 AI 的发展与腾讯混元大模型的实践》的主旨演讲。


刘威于 2012 年获得美国哥伦比亚大学计算机科学与电子工程博士学位,曾任 IBM 沃森研究中心研究科学家。刘威博士长期从事计算机视觉、机器学习、数据挖掘、信息检索等领域的基础研究和产品开发,迄今发表和录用论文 100+ 篇,总引用次数近 5 万次。


刘威曾先后获得 2011 年底 Facebook 博士研究生奖学金、2013 年度哥伦比亚大学优秀博士论文奖、2014 年度计算机视觉与模式识别国际会议 (CVPR) 青年研究者奖、2016 年度国际信息检索大会 (SIGIR) 最优论文荣誉奖。


刘威多次担任国际权威期刊的客座编委与审稿人,自 2007 年起一直担任国际顶级会议 NIPS、CVPR、ICCV 等的程序委员成员,担任第四届自然语言处理与汉语计算会议 NLPCC 2015 的领域主席,并自 2014 年起担任美国自然科学基金信息与智能系统分部 (NSF IIS Division) 的研究项目评审。


2017 年 3 月,刘威从 NSF IIS Division 离职,加盟腾讯 AI Lab,担任 AI Lab 计算机视觉中心总监、广告多媒体 AI 中心总监,负责图像视频数据相关的 AI 研究。


2022 年 11 月,刘威入选 2023 IEEE Fellow,入选理由是对大规模机器学习和智能多媒体的贡献。IEEE Fellow 是 IEEE 授予成员的最高荣誉,每年由同行专家在做出突出贡献的会员中评选出,当选人数不超过 IEEE 会员总人数的 0.1%。


刘威曾对外介绍,腾讯混元大模型名称的由来,表示“混元”在古代汉语中意味着从无序到有序、从混乱到规律的过程,这也正是生成模型的使命。


去年 9 月,腾讯混元大模型上线,之后腾讯又发布了混元大模型 MoE,目前已经涵盖了轻量版到中版,并且轻量版在腾讯云上完全免费。今年 5 月,腾讯混元文生图大模型发布,并宣布开源;到了 9 月,腾讯宣布推出新一代大模型“混元 Turbo”。


腾讯混元积累了大量自研技术,包括创新的专家路由 Routing 算法、独创的 MoE Scaling Law 机制以及合成数据技术,实现模型总体性能相比上一代 Dense 模型提升 50%,在文生图方面,混元实现了基于 LLM + DiT 的生成能力;视频生成上,腾讯混元拥有文生视频、图生视频、图文生视频、视频生视频等多种能力,支持 1k~4k 的分辨率。


“有人问腾讯为何如此拥抱生成式 AI?我认为软件的未来就是生成式 AI。”刘威曾在公开演讲中表示。据悉,目前混元大模型已接入腾讯内部 700 多个司内业务应用及场景,有很多是轻量模型,如微信输入法、微信“搜一搜”、腾讯新闻、腾讯会议、企业微信等。


在推理方面,刘威认为,如果一个 AI 无法推理,人类可以写一个很长的 Prompt 告诉它如何推理,但几年后 ChatBot 可能就不再有用了。因此,AI 的推理能力必须从被动推理变为主动推理。


在刘威看来,大模型越来越大的原因是人们希望无论是多模态、单模态、听说读写还是具身智能,它做越来越多的任务。由于整个方法论范式的改变,从单任务变成了多任务、从单模态变成多模态,多网络变成了一个大网络,这便是系统性的革新。生成式 AI 的系统性变革至少包含三个维度,即方法论的变革、运算模式的变革和算力的变革。


会议推荐


就在 12 月 13 日 -14 日,AICon 将汇聚 70+ 位 AI 及技术领域的专家,深入探讨大模型与推理、AI Agent、多模态、具身智能等前沿话题。此外,还有丰富的圆桌论坛、以及展区活动,满足你对大模型实践的好奇与想象。现在正值 9 折倒计时,名额有限,快扫码咨询了解详情,别错过这次绝佳的学习与交流机会!



2024-11-19 18:0012045

评论

发布
暂无评论
发现更多内容

工作两年涨薪40%,揭秘我的学习之路!

霍格沃兹测试开发学社

浪潮信息边缘服务器支持英特尔第五代至强处理器

财见

自动化测试的痛点与发展趋势

老张

DevOps 自动化测试

【FAQ】HarmonyOS SDK 闭源开放能力 —Map Kit

HarmonyOS SDK

HarmonyOS

从Language Model到Chat Application:对话接口的设计与实现

阿里技术

application Language 设计与实现 对话接口

5月17-19日 上海线下 · CSP直通车训练营 · CST导师亲授【名额有限,先到先得】

ShineScrum

ScrumMaster 敏捷教练认证 上海线下、 Scrum专业认证

【教程】无法验证app需要互联网连接以验证是否信任开发者

雪奈椰子

【愚公系列】2024远控性能大解密!5款评价最高远控软件ToDesk、TeamViewer、向日葵、Parsec、AirDroid谁与争锋?

愚公搬代码

模型驱动测试引领测试开发新风向

霍格沃兹测试开发学社

企业数据内控安全就用行云防水堡!不容错过!

行云管家

数据安全 数据泄露 企业数据 防水堡

Android Input底层机制

江湖修行

android 大前端 移动端 系统源码

一次性搞定多任务!Python自动化复用浏览器技巧大揭秘

测试人

软件测试

网络安全审计是什么意思?与等保测评有什么区别?

行云管家

网络安全 等保测评 网络安全审计

SecGPT-Mini,一个在CPU上可体验的开源网络安全大模型

云起无垠

App原生开发:iOS和Android平台的比较(看这一篇就够了)

天津汇柏科技有限公司

软件开发 APP开发 小程序开发 软件开发定制

测试人生 | 工作两年涨薪40%,揭秘我的学习之路!

测吧(北京)科技有限公司

测试

MySQL数据库中SQL语句分几类?

小魏写代码

抖音详情API:视频内容获取与解析技巧

技术冰糖葫芦

API 接口

2024-03-06:用go语言,每一种货币都给定面值val[i],和拥有的数量cnt[i], 想知道目前拥有的货币,在钱数为1、2、3...m时,能找零成功的钱数有多少? 也就是说当钱数的范围是1~

福大大架构师每日一题

福大大架构师每日一题

下一代积木式智能组装编排,集成开发效率10倍提升

华为云开发者联盟

开发 华为云 华为云开发者联盟 DTSE Tech Talk

[自研开源] 用Docker部署 MyData v0.7.1

LIEN

开源 数据集成 业务融合 API对接 mydata

分享一个能让你的研发效率提升超过20%的工具

华为云开发者联盟

开发 华为云 华为云开发者联盟 华为云CodeArts

如何简化 Kubernetes 出入向流量管理

NGINX开源社区

Kubernetes Ingress Controller NGINX PLUS NGINX Service Mesh mTLS

利用1688商品详情API:快速获取商品信息的技巧与策略

技术冰糖葫芦

API 接口

新学期提效神器汇总!男大女大们准备好了吗?

飞桨PaddlePaddle

百度 BAIDU 百度飞桨 AI应用 飞桨星河社区

INSERT...SELECT语句对查询的表加锁吗

GreatSQL

greatsql

新闻网站封锁AI爬虫 AI与新闻媒体博弈继续

郑州埃文科技

AI 爬虫

电子元器件行业MES系统能解决哪些管理难题?

万界星空科技

工业互联网 制造业 电子元器件 mes 万界星空科技

软件测试工作两年涨薪40%,揭秘我的学习之路!

测试人

软件测试

大模型在产品原型生成中的应用实践

得物技术

大前端

独家|腾讯杰出科学家、混元大模型技术负责人之一刘威离职_腾讯_蔡芳芳_InfoQ精选文章