写点什么

谷歌深夜炸场!发布最强开放模型 Gemma:性能碾压 LLaMA,可在笔记本上运行

  • 2024-02-22
    北京
  • 本文字数:2331 字

    阅读完需:约 8 分钟

大小:1.11M时长:06:28
谷歌深夜炸场!发布最强开放模型Gemma:性能碾压LLaMA,可在笔记本上运行

谁将成为开放模型最强王者?

谷歌发布 Gemma 开放模型

 

在推出最新版 Gemini 型号不到一周后,当地时间 2 月 21 日,谷歌再次公布 Gemma 项目——一个新的轻量化开放权重模型家族,自即日起已开始面向全球开放,可用于商业和研究用途。据悉,Gemma 由 Google DeepMind 及谷歌旗下其他团队开发而成,采用与 Gemini 模型相同的研究与创建技术,并因拉丁语的 gemma“宝石”一词而得名。



谷歌表示,经过预训练及指令微调的 Gemma 模型能够在用户的笔记本电脑、工作站或者 Google Cloud 上运行,并可被轻松部署在 Vertex AI 及 Google Kubernetes Engine(GKE)之上。谷歌称,希望 Gemma 能希望帮助开发人员和研究群体以负责任的方式构建 AI 方案。

 

本次谷歌共发布两种模型权重版本:Gemma 2B 与 Gemma 7B,每个版本都将公开经过预训练与指令微调的变体。除了模型权重之外,谷歌还发布了用于支持开发者创新、促进协作并指导受众以负责任方式使用 Gemma 模型的更多配套工具。比如新的 Responsible Generative AI Toolkit(负责任生成式 AI 套件)将为使用 Gemma 创建安全 AI 应用提供引导与基础工具。此外,谷歌还通过原生 Keras 3.0 提供跨越各主要框架的推理与监督微调(SFT)工具链,包括 JAX、PyTorch 及 TensorFlow 等。

 

除了即开即用的 Colab 和 Kaggle notebooks 以外,谷歌还将整合 Hugging Face、MaxText、英伟达 NeMo 以及 TensorRT-LLM 等流行工具,帮助用户轻松开始使用 Gemma。

 

用户可以利用自己的数据对 Gemma 模型进行微调,从而适应特定应用场景需求,例如摘要或检索增强生成(RAG)。此外,Gemma 还支持多种工具和系统:

 

  • 多框架工具:用户可以随意挑选自己最喜爱的框架,并跨越多框架 Keras 3.0、原生 PyTorch、JAX 以及 Hugging Face Transformers 等建立推理与微调的参考实现。

  • 跨设备兼容:Gemma 模型能够跨越多种流行设备实现运行,包括笔记本电脑、台式机、物联网、移动设备和云,从而实现 AI 功能的广泛可及。

  • 顶尖硬件平台:谷歌与英伟达合作,针对英伟达 GPU 对 Gemma 做出优化,范围涵盖从数据中心到云端、再到本地 RTX AI PC,确保既保持行业领先的性能、又与顶尖硬件适配良好。

  • 针对 Google Cloud 进行优化:Vertex AI 提供广泛的 MLOps 工具集,其中包含一系列微调选项以及包含内置推理优化的一键部署方案。全托管 Vertex AI 工具或自管理 GKE 还可提供高级自定义功能,包括立足任一平台跨越 GPU、TPU 和 CPU 部署起经济高效的 AI 基础设施。

谷歌:Gemma 是同等规模内性能最强模型

 

谷歌并未发布具体的说明文件,将这些模型与 Meta 和 Mistral 等厂商的同类模型做性能对比,而只是泛泛提到 Gemma 模型“行业领先”。目前唯一可以确定的,就是 Gemma 模型家族为密集纯解码器模型,与 Gemini 模型(以及更早的 PaLM 模型)拥有相同的技术和基础设施组件。

 

谷歌表示,与其他开放模型相比,Gemma 2B 与 7B 均在同等规模范围内拥有最出色的性能表现。Gemma 模型能够直接在开发人员的笔记本电脑或台式计算机上运行,而且值得注意的是,Gemma 在关键基准测试中甚至超越了更大模型,同时严格遵守谷歌提出的安全与负责任输出标准。关于 Gemma 性能、数据集构成以及建模方法等细节信息,谷歌还专门发布了一份技术报告:https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf

 


与类似规模的开放模型相比,Gemma 7B在语言理解和生成性能方面的表现。


Gemma 在设计之初就以谷歌的 AI 原则为核心。为了确保 Gemma 预训练模型安全可靠,谷歌采用自动化技术从训练集中筛除掉了某些个人信息及其他敏感数据。此外,谷歌还利用人类反馈(RLHF)对模型进行广泛微调与强化学习,确保指令微调模型始终遵循负责任的行为准则。为了了解并降低 Gemma 模型的风险状况,谷歌还开展了稳健性评估,包括手动红队演练、自动对抗测试以及危险活动模型能力评估等。

 

谷歌还随 Gemma 模型一道发布新的 Responsible Generative AI Toolkit 负责任生成式 AI 套件,旨在帮助开发人员和研究群体优先构建起安全且负责任的 AI 应用程序。这套工具包中包括:

 

  • 安全分类:谷歌提供一种新颖方法,能够以最少的示例构建起强大的安全分类器。

  • 调试:模型调试工具,可帮助用户调查 Gemma 的行为并解决潜在问题。

  • 指引:用户可以根据谷歌在开发和部署大语言模型方面的经验,获取模型构建方面的最佳实践。

开放模型正成为主流

 

虽然谷歌一直强调这些模型的开放属性,但需要注意的是,它们并不属于开源成果。实际上,在之前的新闻发布会上,谷歌公司的 Jeanine Banks 在强调搜索巨头对于开源的承诺之余,曾专门指出谷歌对于 Gemma 模型的开源态度十分谨慎。

 

Banks 解释称,“开放模型如今在行业内已经相当普遍,而且所指的通常是开放权重模型。也就是说,开发人员和研究人员可以广泛使用这些模型,对模型进行定制和微调;但与此同时,使用条款对于重新分发及所开发变体的所有权问题,往往须根据模型自身的特定情况而有所差异。因此,我们认为开放模型与传统意义上的开源模型及开源代码存在一定区别,将 Gemma 模型称为开放模型可能最为贴切。”

 

也就是说,开发人员可以使用该模型进行推理、也可随意对模型进行微调。谷歌团队还认为,这样规模的模型在多种场景下都非常适用。

 

谷歌 DeepMind 产品管理总监 Tris Warkentin 表示,“过去一年以来,生成式 AI 的质量迎来了大幅提升。以往需要超大模型才能完成的工作,如今已经可以在最先进的小型模型上实现。这无疑开发了 AI 应用开发的全新方向,我们对此深感兴奋。如今,我们甚至可以在本地开发者台式机或笔记本电脑上使用 RTX GPU,或者在 Google Cloud Platform 上的单一主机中利用云 TPU 运行大模型推理和微调。”

 

谷歌在这一领域的其他竞争对手也纷纷入场,拿出自己的开放模型。年轻的 Gemma 家族能不能在对抗中胜出,恐怕只有时间能给出答案。

 

参考链接:

https://blog.google/technology/developers/gemma-open-models/

https://techcrunch.com/2024/02/21/google-launches-two-new-open-llms/

2024-02-22 11:589141

评论 1 条评论

发布
用户头像
观察到许多人对Gemma模型持怀疑态度,但不可否认,其在小型设备上的强大运行能力标志着模型轻量化和优化的新时代。这正如在艺术领域,微雕塑之于雕塑,丝毫不减其艺术价值。相信随着技术的进步,Gemma能够为更广泛的场景带来创新解决方案。
2024-02-27 10:39 · 北京
回复
没有更多了
发现更多内容

OpenMLDB官网升级,神秘贡献者地图带你快速进阶!

第四范式开发者社区

人工智能 机器学习 数据库 开源 特征

java培训Redis数据结构面试分享

@零度

redis JAVA开发

web前端培训React性能优化总结

@零度

前端开发 React

【Linux深潜】详解Linux系统自身安全调优配置

沃趣科技

Linux

node爬虫爬取小说章节

空城机

爬虫 Node 5月月更

WordPress 固定链接设置

海拥(haiyong.site)

5月月更

墨天轮访谈 | 百度云邱学达:GaiaDB如何解决云上场景的业务需求?

墨天轮

数据库 百度云 国产数据库

AI驱动音乐创新,网易数帆X云音乐刷新MIREX世界纪录

网易数帆

人工智能 AI 语音识别 歌词识别 预练习

跟我学Python图像处理丨掌握4种图像平滑算法

华为云开发者联盟

Python OpenCV 图像属性 兴趣ROI区域 图像通道

大咖说 X 智篆商业|未来五年:消费增长的“两大来源”与“四个方面”

大咖说

阿里云 存量时代 智篆商业

OpenHarmony 3GPP协议开发深度剖析——一文读懂RIL

OpenHarmony开发者

OpenHarmony RIL

豆瓣评分8.5,详细讲解Python基础知识和应用的百科全书来了!

图灵教育

Python 程序员 计算机

百问百答第37期:如何一次性贯穿前后请求,调用链告诉你答案

博睿数据

调用链 博睿数据 IT运维

加速虚拟与现实交互,2022视觉计算私享会邀请你一起沉浸体验

阿里云弹性计算

vr 虚拟现实 元宇宙 视觉计算

OpenHarmony兼容性平台更新上线

OpenHarmony开发者

OpenHarmony 兼容性平台

【等保测评】2022年深圳等保测评公司排名看这里!

行云管家

等保 深圳 等保测评 等保2.0

升级HarmonyOS 2最新版本,出门亮健康码快人一步!

科技汇

OpenHarmony布道师招募正式启动,打造个人技术影响力的机会来了!

科技汇

CWE 4.7中的新视图:工业控制系统的安全漏洞类别

华为云开发者联盟

安全漏洞 cwe 软件安全 CWE 4.7 工业控制系统

连续3年实力登榜!EMQ映云科技再度跻身“2022中国边缘计算企业20强”

EMQ映云科技

物联网 IoT 边缘计算 emq 5月月更

易周金融观点 | 支付机构入局数字藏品;Q1手机银行交易超150万亿

易观分析

金融

主流开源分布式图计算框架 Benchmark

NebulaGraph

图计算 分布式图数据库

RGB色彩空间

Loken

音视频 5月月更

黎明前的至暗时刻,旅企是该坚守还是放弃?

易观分析

旅游业

如何写出GC更优的代码,以达到提升代码性能的目的

非凸科技

性能 编程语言 垃圾回收 GC 吞吐率

融云参编,业界首个办公即时通信软件安全标准重磅发布!

融云 RongCloud

做本让客户念念不忘的产品手册

小炮

产品手册

Connection reset

领创集团Advance Intelligence Group

Connection reset

云图说|DDS读写两步走,带您领略只读节点的风采

华为云开发者联盟

数据库 华为云 读写分离 DDS

还有谁不知道CRM系统可以为企业做这些?

低代码小观

CRM 客户关系管理 CRM系统 客户关系管理系统 企业管理软件

谷歌深夜炸场!发布最强开放模型Gemma:性能碾压LLaMA,可在笔记本上运行_Google_凌敏_InfoQ精选文章