写点什么

智谱 AI:国产全自研大模型商业化落地新解法

智谱AI

  • 2024-03-14
    北京
  • 本文字数:2820 字

    阅读完需:约 9 分钟

智谱AI:国产全自研大模型商业化落地新解法

3 月 14 日,智谱 AI 举办了“智领,万象新生” 智谱 AI 媒体小型沟通会。智谱 AI 是国内最早入局大模型赛道的公司之一,立足当下,在过去几年中,智谱 AI 大模型从落地发芽到茁壮成长,展现了新的科技是如何与日常生活、生产等场景相交相融;又面向未来,在与央视网的《望海对谈》中,首席执行官张鹏与央视网主持人畅聊了人工智能时代大潮里,国产全自研 AI 大模型的新机遇、未来发展的新目标、赋能万物的新范式,与央视网以“支持国产 赋能品牌”为核心的「人人都爱中国造」品牌助力行动携手,共同焕新人们生活新方式。


国产新力量:全链路自主可控大模型


热议一年有余的 AI 大模型到底是什么?它能帮助人们做什么?


在智谱 AI 推出的生成式 AI 助手“智谱清言”中输入“AI 大模型是什么”,得到的答案是,AI 大模型通常指的是大型的人工智能算法模型,这些模型拥有庞大的参数数量,需要大量的数据来训练,并且能够执行复杂的任务。它们通常用于自然语言处理、图像识别、声音识别和其他人工智能领域。这些模型通过不断地学习和调整,以提高其准确性和泛化能力。


智谱 AI 是国内头部大模型厂商的代表之一,公司成立于 2019 年 6 月,这远早于 ChatGPT 一鸣惊人继而引起全球大模型热潮的时间。据智谱 AI 首席执行官张鹏介绍,智谱 AI 源于清华大学技术成果成立,创始团队此前一直在清华大学计算机系 KEG 实验室工作,实验室汇集了行业领军人才,一直密切关注、探讨下新一代人工智能技术会往哪个方向发展。“近十年时间,我们一直从事人工智能技术相关的研究和产业落地工作。”张鹏介绍,团队经常接触到人工智能技术发展最前沿资讯,感受到下一个时代人工智能技术阶梯式、飞跃式的发展潜力,基于“把过去十几年实验室的研究成果转化为落地实际技术和产品的想法,成立了智谱 AI。”公司成立后,致力于打造新一代认知智能大模型,专注于做大模型的中国创新,且有一套独属于自己的研发模式,据张鹏介绍,“这是一种典型区别于过去科技产品研发模式的全新生产模式,我们叫‘产学研用’紧密压缩的闭环,所以我们的团队里的人才是非常的多样化,大家分工协作,但是又紧密地团结在一起去完成这样一个艰巨的挑战。”



智谱 AI 最大的核心竞争力,就是其实现了大模型生成 AI 的全链路自主可控,专注做大模型的中国创新。智谱 AI 自研了具有完全知识产权的预训练框架 GLM, 并自建训练平台,拥有从零开始搭建平台和运维平台的能力。公司 2022 年合作研发了中英双语千亿级超大规模预训练模型 GLM-130B——同年,斯坦福大学大模型中心对全球 30 个主流大模型进行了全方位的评测,GLM-130B 是亚洲唯一入选的大模型,准确性、恶意性与 GPT-3 持平,鲁棒性和校准误差在所有模型中表现最佳 。


2024 年 1 月,新一代基座大模型 GLM-4 正式推出,支持更长的上下文,具备更强的多模态能力;同时,GLM-4 智能体能力得到大幅提升,可根据用户意图,自动理解、规划指令以完成复杂任务;GLMs 个性化智能体定制功能亦同时上线。


此次举办的“智领,万象新生”媒体小型沟通会,就是拥有自主研发能力的国产大模型公司,进一步对外界打开了窥得先机的一扇窗口,用最形象生动、最贴切生活的实践应用案例,展示以智谱 AI 为代表的自产自研人工智能如何引领社会进入一个全新的智能化时代。


提质新智能:专业科技走向大众生活


在智谱 AI 公布落地行业案例之前,业界对其的关注度一直很高,关注的焦点主要在于其自研模型具备的通用性以及多模态能力。


2023 年 8 月,智谱 AI 的生成式 AI 助手“智谱清言”作为第一批通过备案的大模型产品上线。据了解,智谱清言基于智谱 AI 的基座大模型开发,通过万亿字符的文本与代码预训练,结合有监督微调技术,具备通用问答、多轮对话、创意写作、代码生成、虚拟对话、AI 画图、文档和图片解读等能力。


作为职场打工人,利用智谱清言可以进行工作汇总、优化简历、完成项目 ppt 框架搭建;作为学生,可以在智谱清言的帮助下辅导作业、制定复习计划、做调研课题的资料收集;自媒体人需要撰写个人账号文案、拍摄脚本、公众号创作策略时,智谱清言也能提供帮助;想要给自己设计一个个性化头像?智谱清言也能轻松产出……我们已慢慢习惯了 AI 大模型在我们的日常中给予协助。


沟通会现场,智谱 AI 首席执行官张鹏发布了企业宣传片以及智谱大模型商业化案例合集。案例合集中包含多个领域的头部公司,涵盖了传媒、咨询、消费、金融、新能源、互联网、智能办公等多个细分场景。张鹏讲述了过去一年中智谱 AI 是如何利用自主研发技术,通过强大的通用能力和高度可定制特性,实现大模型的商业化落地。


通过张鹏介绍的应用案例可以看到,“他们(客户)认为人工智能技术一定是未来下一阶段生产力的基座,很重要的一个基座,会把人工智能这个能力作为他们整个企业或者是机构内部的能力基础来建设,所以我们可以认为它是一种新型的基础设施。”


科技新起航:“造浪”者勇立时代潮头


2024 年的《政府工作报告》对深入推进数字经济创新发展提出全新工作任务:“制定支持数字经济高质量发展政策,积极推进数字产业化、产业数字化,促进数字技术和实体经济深度融合。深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字产业集群……”


2019 年至今,国际大模型风起云涌,智谱 AI 正在经历大模型的大航海时代。面对未知的未来,面对世界范围内各大巨头、研究机构的竞争,国产的人工智能技术该如何打破国际技术壁垒,扬帆起航?如何成为“人工智能+”的弄潮儿、实践者,为千行百业带来持续的赋能、创新与变革?


智谱表示:“智领,万象新生”


张鹏在采访中提出:“要把人工智能摆在核心的地位上,期待用人工智能技术来改造或者创造全新的生产范式。”一言以蔽之,应当助推“人工智能+”,不是“+人工智能”,“把蛋糕做大,找到新的发展空间,寻求新的生产效果,大幅提升可创新的空间,实现生产效率的大幅提升。”


 

沟通会现场,张鹏还对智谱 AI 公司的自主研发技术表达了一个亲身实践者的见解。



他表示,智谱 AI 一直以来在思考“如何让人类和人工智能和谐共存?”“首先人工智能的智能水平必须要进化到一定的程度,要跟人能够正常沟通,理解人类的意图。第二,一定要有‘安全’这样一个限制和枷锁,所以我们还有一个重要的任务,就是要培养人工智能这个智能个体的正确价值观和世界观,只有这样才能够防止它被坏人利用,更好地为人类服务。”


当全社会的目光在关注科技行业日新月异进展的时候,或许会在不知不觉中发现,AI 大模型已经植入生活、融入日常,砥砺前行的国产自研人工智能技术已经加速深入寻常百姓家。


活动推荐


大模型的趋势将引领多个行业的发展,甚至是软件开发自身这个行业,也会受到冲击或者说刺激,AI 程序员已经问世,那以后的技术架构会有怎样的变化呢?


在 6 月 14-15 日深圳ArchSummit架构师峰会上,讲邀请来自 CNCF、百度、阿里、Uber、字节跳动等企业专家来分享各自在技术上的最新进展,例如 AI 大模型中台从理念到实践的探索、Data 4 AI 和 AI 4 Data 方面的探索等,欢迎感兴趣的朋友来会议现场交流。现在购票立享 8 折优惠,电联 17310043226(同微信)。


2024-03-14 15:4910237

评论

发布
暂无评论
发现更多内容

《JAVA多线程设计模式》.pdf

田维常

多线程

公众号高频被调整,它不是企业生产文章的机器

Linkflow

客户数据平台 CDP 私域流量

架构师训练营第九周作业

我是谁

极客大学架构师训练营

UNISKIN COO Kevin|营销数字化:数据沉淀和数据系统化运营一定要趁早!

Linkflow

营销数字化 客户数据平台 CDP

强化学习入门必看之强化学习导识

Alocasia

人工智能 学习

阿里达摩院副院长亲自所写Java架构29大核心知识体系+大厂面试真题+微服务

Java架构追梦

Java 学习 阿里巴巴 架构 面试

一致性hash算法

天涯若海

区块链数字钱包系统开发方案,区块链钱包APP源码

13530558032

DataPipeline CPO 陈雷:实时数据融合之道,博观约取,价值驱动

DataPipeline数见科技

数据融合

DataPipeline CPO 陈雷:实时数据融合之法,稳定高容错

DataPipeline数见科技

数据融合

DataPipeline CTO 陈肃:构建批流一体数据融合平台的一致性语义保证

DataPipeline数见科技

数据融合

深入浅出 Go - sync.Map 源码分析

helbing

Go 语言

Istio 1.8 发布——用户至上的选择

Jimmy Song

开源 云原生 Service Mesh istio

万字图文 | 聊一聊 ReentrantLock 和 AQS 那点事(看完不会你找我)

马丁玩编程

架构 AQS ReentrantLock JUC CLH

接口测试学习之json

测试人生路

json 接口测试

深入浅出 Go - sync.Once 源码分析

helbing

Go 语言

微信官方将打击恶意营销号:自媒体不可过度消费粉丝

石头IT视角

区块链社交即时通许系统开发,区块链社交app开发价格

13530558032

面试官问:如何排除GC引起的CPU飙高?我脱口而出5个步骤

田维常

cpu飙满

11月阿里Spring全家桶+MQ微服务架构笔记:源码+实战

小Q

Java 学习 程序员 面试 微服务

Scrum指南这么改,我看要完蛋!

华为云开发者联盟

Scrum 敏捷 改版

数字货币交易所开发有哪些模式?区块链交易平台

13530558032

媲美物理机,裸金属云主机如何轻松应对11.11大促

京东科技开发者

云计算 容器 服务器 云主机

Springboot过滤器和拦截器详解及使用场景

996小迁

Java 编程 架构 面试 springboot

快进收藏吃灰!字节跳动大佬用最通俗方法讲明白了红黑树算法

小Q

Java 学习 架构 面试 算法

MySQL主从数据库没有同步怎么办?

冰河

MySQL 数据库 分布式 微服务

深入理解h2和r2dbc-h2

程序那些事

响应式编程 R2DBC 程序那些事 响应式架构 r2dbc-h2

合约跟单源码案例,合约跟单模式开发

13530558032

架构师训练营第九周作业

_

极客大学架构师训练营 第九周作业

DataPipeline CPO 陈雷:实时数据融合之法,便捷可管理

DataPipeline数见科技

数据融合

OpenFeign和Consul爱恨交织的两天

编号94530

Spring Cloud Consul OpenFegin spring 5

智谱AI:国产全自研大模型商业化落地新解法_OpenAI_InfoQ精选文章