HarmonyOS开发者限时福利来啦!最高10w+现金激励等你拿~ 了解详情
写点什么

谷歌深夜炸场!发布最强开放模型 Gemma:性能碾压 LLaMA,可在笔记本上运行

  • 2024-02-22
    北京
  • 本文字数:2331 字

    阅读完需:约 8 分钟

大小:1.11M时长:06:28
谷歌深夜炸场!发布最强开放模型Gemma:性能碾压LLaMA,可在笔记本上运行

谁将成为开放模型最强王者?

谷歌发布 Gemma 开放模型

 

在推出最新版 Gemini 型号不到一周后,当地时间 2 月 21 日,谷歌再次公布 Gemma 项目——一个新的轻量化开放权重模型家族,自即日起已开始面向全球开放,可用于商业和研究用途。据悉,Gemma 由 Google DeepMind 及谷歌旗下其他团队开发而成,采用与 Gemini 模型相同的研究与创建技术,并因拉丁语的 gemma“宝石”一词而得名。



谷歌表示,经过预训练及指令微调的 Gemma 模型能够在用户的笔记本电脑、工作站或者 Google Cloud 上运行,并可被轻松部署在 Vertex AI 及 Google Kubernetes Engine(GKE)之上。谷歌称,希望 Gemma 能希望帮助开发人员和研究群体以负责任的方式构建 AI 方案。

 

本次谷歌共发布两种模型权重版本:Gemma 2B 与 Gemma 7B,每个版本都将公开经过预训练与指令微调的变体。除了模型权重之外,谷歌还发布了用于支持开发者创新、促进协作并指导受众以负责任方式使用 Gemma 模型的更多配套工具。比如新的 Responsible Generative AI Toolkit(负责任生成式 AI 套件)将为使用 Gemma 创建安全 AI 应用提供引导与基础工具。此外,谷歌还通过原生 Keras 3.0 提供跨越各主要框架的推理与监督微调(SFT)工具链,包括 JAX、PyTorch 及 TensorFlow 等。

 

除了即开即用的 Colab 和 Kaggle notebooks 以外,谷歌还将整合 Hugging Face、MaxText、英伟达 NeMo 以及 TensorRT-LLM 等流行工具,帮助用户轻松开始使用 Gemma。

 

用户可以利用自己的数据对 Gemma 模型进行微调,从而适应特定应用场景需求,例如摘要或检索增强生成(RAG)。此外,Gemma 还支持多种工具和系统:

 

  • 多框架工具:用户可以随意挑选自己最喜爱的框架,并跨越多框架 Keras 3.0、原生 PyTorch、JAX 以及 Hugging Face Transformers 等建立推理与微调的参考实现。

  • 跨设备兼容:Gemma 模型能够跨越多种流行设备实现运行,包括笔记本电脑、台式机、物联网、移动设备和云,从而实现 AI 功能的广泛可及。

  • 顶尖硬件平台:谷歌与英伟达合作,针对英伟达 GPU 对 Gemma 做出优化,范围涵盖从数据中心到云端、再到本地 RTX AI PC,确保既保持行业领先的性能、又与顶尖硬件适配良好。

  • 针对 Google Cloud 进行优化:Vertex AI 提供广泛的 MLOps 工具集,其中包含一系列微调选项以及包含内置推理优化的一键部署方案。全托管 Vertex AI 工具或自管理 GKE 还可提供高级自定义功能,包括立足任一平台跨越 GPU、TPU 和 CPU 部署起经济高效的 AI 基础设施。

谷歌:Gemma 是同等规模内性能最强模型

 

谷歌并未发布具体的说明文件,将这些模型与 Meta 和 Mistral 等厂商的同类模型做性能对比,而只是泛泛提到 Gemma 模型“行业领先”。目前唯一可以确定的,就是 Gemma 模型家族为密集纯解码器模型,与 Gemini 模型(以及更早的 PaLM 模型)拥有相同的技术和基础设施组件。

 

谷歌表示,与其他开放模型相比,Gemma 2B 与 7B 均在同等规模范围内拥有最出色的性能表现。Gemma 模型能够直接在开发人员的笔记本电脑或台式计算机上运行,而且值得注意的是,Gemma 在关键基准测试中甚至超越了更大模型,同时严格遵守谷歌提出的安全与负责任输出标准。关于 Gemma 性能、数据集构成以及建模方法等细节信息,谷歌还专门发布了一份技术报告:https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf

 


与类似规模的开放模型相比,Gemma 7B在语言理解和生成性能方面的表现。


Gemma 在设计之初就以谷歌的 AI 原则为核心。为了确保 Gemma 预训练模型安全可靠,谷歌采用自动化技术从训练集中筛除掉了某些个人信息及其他敏感数据。此外,谷歌还利用人类反馈(RLHF)对模型进行广泛微调与强化学习,确保指令微调模型始终遵循负责任的行为准则。为了了解并降低 Gemma 模型的风险状况,谷歌还开展了稳健性评估,包括手动红队演练、自动对抗测试以及危险活动模型能力评估等。

 

谷歌还随 Gemma 模型一道发布新的 Responsible Generative AI Toolkit 负责任生成式 AI 套件,旨在帮助开发人员和研究群体优先构建起安全且负责任的 AI 应用程序。这套工具包中包括:

 

  • 安全分类:谷歌提供一种新颖方法,能够以最少的示例构建起强大的安全分类器。

  • 调试:模型调试工具,可帮助用户调查 Gemma 的行为并解决潜在问题。

  • 指引:用户可以根据谷歌在开发和部署大语言模型方面的经验,获取模型构建方面的最佳实践。

开放模型正成为主流

 

虽然谷歌一直强调这些模型的开放属性,但需要注意的是,它们并不属于开源成果。实际上,在之前的新闻发布会上,谷歌公司的 Jeanine Banks 在强调搜索巨头对于开源的承诺之余,曾专门指出谷歌对于 Gemma 模型的开源态度十分谨慎。

 

Banks 解释称,“开放模型如今在行业内已经相当普遍,而且所指的通常是开放权重模型。也就是说,开发人员和研究人员可以广泛使用这些模型,对模型进行定制和微调;但与此同时,使用条款对于重新分发及所开发变体的所有权问题,往往须根据模型自身的特定情况而有所差异。因此,我们认为开放模型与传统意义上的开源模型及开源代码存在一定区别,将 Gemma 模型称为开放模型可能最为贴切。”

 

也就是说,开发人员可以使用该模型进行推理、也可随意对模型进行微调。谷歌团队还认为,这样规模的模型在多种场景下都非常适用。

 

谷歌 DeepMind 产品管理总监 Tris Warkentin 表示,“过去一年以来,生成式 AI 的质量迎来了大幅提升。以往需要超大模型才能完成的工作,如今已经可以在最先进的小型模型上实现。这无疑开发了 AI 应用开发的全新方向,我们对此深感兴奋。如今,我们甚至可以在本地开发者台式机或笔记本电脑上使用 RTX GPU,或者在 Google Cloud Platform 上的单一主机中利用云 TPU 运行大模型推理和微调。”

 

谷歌在这一领域的其他竞争对手也纷纷入场,拿出自己的开放模型。年轻的 Gemma 家族能不能在对抗中胜出,恐怕只有时间能给出答案。

 

参考链接:

https://blog.google/technology/developers/gemma-open-models/

https://techcrunch.com/2024/02/21/google-launches-two-new-open-llms/

2024-02-22 11:588738

评论 1 条评论

发布
用户头像
观察到许多人对Gemma模型持怀疑态度,但不可否认,其在小型设备上的强大运行能力标志着模型轻量化和优化的新时代。这正如在艺术领域,微雕塑之于雕塑,丝毫不减其艺术价值。相信随着技术的进步,Gemma能够为更广泛的场景带来创新解决方案。
2024-02-27 10:39 · 北京
回复
没有更多了
发现更多内容

十月 Web3 游戏行业报告:市值增长背后的用户获取挑战

Footprint Analytics

gamefi NFT链游 Web3 游戏

迈向全球,从选择海外高防服务器开始,为您的业务提供坚实保障

一只扑棱蛾子

海外高防服务器

AI 赋能脑科学,和鲸科技与灵脑科技达成战略合作

ModelWhale

人工智能 数据科学 脑科学 类脑计算 交叉学科

mac防火墙 Radio Silence v3.2激活版

iMac小白

Radio Silence下载 Radio Silence破解版

面对瓶颈期,中国ToB SaaS如何实现全面突围?

ToB行业头条

WebGL+H5智慧海上风场可视化远程运维平台

2D3D前端可视化开发

物联网 数字孪生 三维可视化 智慧海上风电

Spring 微服务:数据压缩技术

互联网工科生

spring 微服务 云原生 数据压缩

.NET 8 IEndpointRouteBuilder详解

不在线第一只蜗牛

.net 编程语言

Infuse for Mac(强大的音视频播放器)

iMac小白

Infuse下载 Mac版Infuse下载 Infuse 中文 Infuse播放器

Capture One 23 Enterprise for Mac中文激活版

iMac小白

Capture One 23Enterprise Capture One 23

As Const:一个被低估的 TypeScript 特性

树上有只程序猿

typescript as const

Glyphs 2 for Mac(字体设计编辑软件) v2.6.6(1350)永久激活版

mac

windows 苹果mac 字体设计软件 Glyphs 2

植物补光灯,哪种效果好?

电子信息发烧客

云图说|什么是可信智能计算服务TICS

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 华为云云图说

【开源三方库】Easyui:基于OpenAtom OpenHarmony ArkUI深度定制的组件框架

OpenHarmony开发者

OpenHarmony

软件测试/测试开发/人工智能丨 利用ChatGPT编写测试用例

测试人

人工智能 软件测试 测试用例 ChatGPT

探秘亚马逊云科技海外服务器 | 解析跨境云计算的前沿技术与应用

-亦世凡华、

服务器 经验分享 海外服务器 亚马逊服务器

HarmonyOS NEXT调优工具Smart Perf Host高效使用指南

新消费日报

10款市场分析工具大盘点:哪款是你的首选?

彭宏豪95

效率工具 科技 在线白板 竞品分析 市场分析

基于深度学习的情感语音识别模型优化策略

来自四九城儿

OmniOutliner Pro mac 中文专业版下载

iMac小白

OmniOutliner Pro下载 OmniOutliner Pro破解 OmniOutliner Pro激活

选择 REST ,还是 GraphQL

高端章鱼哥

Rest graphql

万千企业,数智世界,一触即达

脑极体

数智化

Paste for Mac(剪切板管理工具) v4.1.2免激活版

iMac小白

Paste for Mac Paste下载 Paste中文版

Path Finder for Mac中文破解版

iMac小白

Path Finder Path Finder破解 Path Finder下载

Spring 缓存注解这样用,太香了!

越长大越悲伤

Java redis spring 缓存 springboot

谷歌深夜炸场!发布最强开放模型Gemma:性能碾压LLaMA,可在笔记本上运行_Google_凌敏_InfoQ精选文章