写点什么

智谱新发开源大模型:9B 参数,覆盖编程场景

  • 2024-07-06
    北京
  • 本文字数:1314 字

    阅读完需:约 4 分钟

大小:726.83K时长:04:08
智谱新发开源大模型:9B参数,覆盖编程场景

“大模型能够在一个模型上提供泛化能力,解决一系列场景和应用的多样需求,从而解决成本和收益的平衡的问题,这是它的本质特点。”


7 月 4 日,在世界人工智能大会的产业发展主论坛上,智谱 AI CEO 张鹏表示,当下因大模型而掀起的 AI 热潮和之前有所不同,在过去,AI 技术解决了一些实际问题,但如今的大模型发展带来了更重要的类人认知能力。张鹏表示,在过去 AI 泛用性不够且成本太高。但大模型带来了一个新的机遇,它能够在一个模型上提供泛用化能力,这也是用新一代大模型技术赋能实体经济的主要方向——把原来一个底座投入很大但是收益很小的结构,变成一个倒金字塔结构,真正放大它的价值。



GLM-新一代基座大模型技术前沿与产业应用论坛举办

 

7 月 5 日,在由清华大学计算机系知识工程实验室主办,AI TIME 承办,东浩兰生(集团)有限公司和智谱 AI 协办的 GLM-新一代基座大模型技术前沿与产业应用论坛上,嘉宾们聚焦 GLM-4 大模型,共同分享了 GLM-4 大模型的最新研究成果和理论突破,探索 GLM-4 的技术前沿、产业生态和落地应用。

第 4 代 CodeGeeX 发布免费智能 AI 编程助手



论坛上,智谱 AI CodeGeeX 技术负责人郑勤锴发布了第 4 代 CodeGeeX 代码大模型 CodeGeeX4-ALL-9B。CodeGeeX4-ALL-9B 作为最新一代 CodeGeeX4 系列模型的开源版本,在 GLM-4 强大语言能力的基础上继续迭代,大幅增强代码生成能力。使用 CodeGeeX4-ALL-9B 单一模型,即可支持代码补全和生成、代码解释器、联网搜索、工具调用、仓库级长代码问答及生成等全面功能,覆盖了编程开发的各种场景。在多个权威代码能力评测集的表现,是百亿参数量级以下性能最强的模型,甚至超过数倍规模的通用模型,在推理性能和模型效果上得到最佳平衡。



目前 CodeGeeX 的个人用户数量已经超过 100 万,目前 CodeGeeX 对个⼈用户完全免费,在各种主流 IDE 均可免费下载使⽤。


除了第 4 代 CodeGeeX 发布,论坛现场,清华大学计算机科学与技术系长聘教授黄民烈、中国人民大学信息学院计算机系副教授张静、浙江大学计算机科学与技术学院副教授杨洋、上海交通大学电子信息与电气工程学院长聘教轨副教授戴国浩、幂律智能创始人兼 CEO 涂存超等顶尖学者,深入探讨了 GLM 大模型对行业及产业发展的影响。


张鹏分享了 GLM-4 在应用中的多个创新案例,特别是在智能内容生成、行业自动化以及用户个性化定制服务等方面的突破。展示了 GLM-4 在复杂商业环境中的价值。


“过去几年智谱的商业实践为我们积累了非常多的经验,不敢说是 best practice,但是 better practice。”张鹏在演讲中表示。GLM-4 在智能体和工具调用等方面能力的突飞猛进,让企业内部原生 AI 架构的实现变为可能。


GLM 基座大模型携应用成果亮相 WAIC 2024

 

WAIC 2024 智谱 AI 展位展示了以智谱大模型开放平台 bigmodel.cn 和智谱大模型产品矩阵为核心的系列创新成果。


作为本届 WAIC 镇馆之宝,智谱大模型开放平台 bigmodel.cn 是体验智谱 GLM 系列大模型的最佳方式。全新升级的 bigmodel.cn 已经接入最新 GLM 大模型全家桶,一键微调、All Tools API 调用等新功能也已上线。

 

不管是技术极客、专业工程师,又或者是寻求大模型能力的企业,都可以在平台上找到适合自己的产品和服务。目前 bigmodel.cn 已有超过 40 万企业客户和开发者,日均调用量为 600 亿 Tokens,过去 4 个月 API 每日消费量增长了 90 倍以上。

2024-07-06 17:055242
用户头像
李冬梅 加V:busulishang4668

发布了 913 篇内容, 共 501.6 次阅读, 收获喜欢 1086 次。

关注

评论

发布
暂无评论

教你两招,解决数据膨胀

华为云开发者联盟

数据 GaussDB(DWS) VACUUM 数据膨胀 FSM

谁说双非本就一定无缘阿里!(四年crud经验已拿下P7)面经分享

Java 程序员 架构 面试 计算机

公安情报研判分析系统解决方案,合成作战系统搭建

80后自立门户,90后异军突起,中国投资新势力加速崛起 | 创业邦2021年40位40岁以下投资人重磅发布

创业邦

创业

校友会小程序开发笔记三:数据库设计

CC同学

小程序云开发 校友录小程序 校友会小程序

校友会小程序开发笔记四:UI基本元素设计

CC同学

小程序云开发

WebRTC 传输安全机制第二话:深入显出 SRTP 协议

阿里云视频云

音视频 WebRTC 通信 流媒体开发 SRS流媒体服务器

第六课作业

杰语

专科小伙豪取三杀,斩获阿里、京东和蚂蚁Java岗offer的原因找到了!

北游学Java

Java 面试

关于Redis分布式锁的那些事

Hex

redis 后端

校友会小程序开发笔记二:功能需求设计

CC同学

小程序云开发 校友录小程序 校友会小程序

Bzz节点分币系统开发,云算力矿机租赁系统搭建

可视化协助矿山,打造“高效率运营战略”,年降成本500W

一只数据鲸鱼

数据可视化 工业4.0 智慧矿山

5W1H聊开源之Who/When/Where——谁在何时何地“发明”了开源?

禅道项目管理

Linux 开源 软件

搭建Prometheus+Grafana的云平台监控系统

学神来啦

云计算 Linux 运维 开发日志

详解 Go 程序的启动流程,你知道 g0,m0 是什么吗?

煎鱼

Java php 后端 Go 语言

pprof排查Golang服务内存问题

循环智能

pprof 性能分析 Go 语言

凭这份pdf每天花2小时学习,3个月后拿下阿里/美团/京东等offer

Java 程序员 架构 面试

移动开发iOS,薪资如何?待遇怎样!

ios开发 iOS 知识体系

Flink User-Defined Source

Alex🐒

flink 翻译 Flink扩展 flink1.13

2021年版,拼多多/阿里/今日头条/京东 Java面经大合集(含答案)

Java架构师迁哥

🌏【架构师指南】分布式技术知识点总结(上)

洛神灬殇

分布式 raft协议 paxos协议 6月日更

测试工程师如何收拾交接项目的烂摊子

陈磊@Criss

测试

网易有道开源EMLL:高性能端侧机器学习计算库,大幅提高计算性能

有道技术团队

人工智能 机器学习 高性能计算 端侧AI

分布式能解决一切问题吗?百度架构师为你解答架构真正奥义!

Java架构师迁哥

iOS开发21年6月面试总结(未完待续~)

iOSer

ios 面试 ios开发 iOS 知识体系

阿里云视频云 Retina 多媒体 AI 体验馆开张啦!

阿里云视频云

阿里云 短视频 视频处理 媒体处理 视频制作

校友会小程序开发笔记一:背景与技术方案的选型

CC同学

小程序云开发 校友录小程序 校友会小程序

开发者如何构建技术影响力

不脱发的程序猿

程序人生 开发者如何构建技术影响力 技术影响力

[译] 规避供应商以及特定版本的 VM Bugs

Antway

6月日更

新思科技宣布收购 Code Dx公司 添加软件漏洞关联、优先级和合并风险报告

InfoQ_434670063458

新思科技

智谱新发开源大模型:9B参数,覆盖编程场景_生成式 AI_李冬梅_InfoQ精选文章