写点什么

大模型赛道再添新玩家,快手自研大模型“快意”亮相

  • 2023-08-21
    北京
  • 本文字数:878 字

    阅读完需:约 3 分钟

大模型赛道再添新玩家,快手自研大模型“快意”亮相

近日,快手自研的大语言模型“快意”(KwaiYii)已开启内测,并为业务团队提供了标准 API 和定制化项目合作方案。

 

GitHub 链接:

https://github.com/kwai/KwaiYii

 

据官方介绍,快意大模型(KwaiYii) 是由快手 AI 团队从零到一独立自主研发的一系列大规模语言模型(Large Language Model,LLM),当前包含了多种参数规模的模型,并覆盖了预训练模型(KwaiYii-Base)、对话模型(KwaiYii-Chat)。

 

其中,13B 规模的系列模型 KwaiYii-13B 主要特点包括:


  • KwaiYii-13B-Base 预训练模型具备强大的通用技术支撑能力,在鳄鱼权威的中/英文基准上取得了同等模型尺寸下的 State-Of-The-Art 效果。例如,KwaiYii-13B-Base 预训练模型在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前达到同等模型规模的领先水平。

  • KwaiYii-13B-Chat 对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务,人工评估结果表明 KwaiYii-13B-Chat 超过主流的开源模型,并在内容创作、信息咨询和数学解题上接近 ChatGPT(3.5)同等水平。

 

据介绍,快意大模型(KwaiYii)在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前处于同等模型规模的领先水平,在最新的 CMMLU 中文向排名中,快意的 13B 版本 KwaiYii-13B 同时位列 five-shot 和 zero-shot 下的第一名,在人文学科、中国特定主题等方面较强,平均分超 61 分。

 

KwaiYii-13B-Chat 对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务。


快手方面表示,从人工评估的结果来看,KwaiYii-13B-Chat 超过了同等规模的开源模型,并接近 ChatGPT 同等水平。在内容创作、信息咨询、逻辑推理和数学解题上,基本与 ChatGPT(3.5)效果相当。在多轮对话能力方面,KwaiYii-13B-Chat 超过同等规模的开源模型,但与 ChatGPT(3.5)仍有一定差距。注意:人工评估结果受到评测数据覆盖面、标注主观性等因素的影响,无法全面反映大语言模型的所有能力。



据悉,快手 AI 团队将持续迭代“快意”大模型,一方面将继续优化模型性能并研发多模态能力 ,另一方面也在推进更多 C 端与 B 端业务场景下的落地 。

2023-08-21 11:294119

评论

发布
暂无评论
发现更多内容

提升网站性能:Nginx五种高效负载均衡策略

百度搜索:蓝易云

nginx 云计算 Linux 运维 Web

Mac系统清理和优化软件 CleanMyMac X

展初云

CleanMyMac X Mac软件 系统优化工具

数字孪生 重塑世界 ——2023飞渡科技数字孪生行业研讨会深圳站圆满成功

Geek_2d6073

这场研讨会硬件工程师不要错过

华秋电子

降本增效的集成平台

RestCloud

ipaas

🎊OpenTiny Vue 3.11.0 发布:增加富文本、ColorPicker等4个新组件,迎来了贡献者大爆发!

Kagol

自定义过滤器配置 Shiro 认证失败返回 json 数据

emanjusaka

Java shiro

Mac可用的GTD任务管理软件Omnifocus Pro 3

展初云

Mac软件 任务管理软件 GTD

如何平衡表单设计过程中用户体验与企业管控需求(上)

用友BIP

财务共享

释放浏览器潜力:Web Scheduler 背后的系统性能提升

Geek_ianp87

前端 性能 浏览器 js 前端框架

Python 继承和子类示例:从 Person 到 Student 的演示

小万哥

Python 程序员 软件 后端 开发

Mac可用的流程图和图形设计软件OmniGraffle Pro 7

展初云

Mac 流程图绘制工具

软件开发全文档整理(获取原件)

金陵老街

项目管理 软件文档

Mac电脑专业批量文件重命名 MetaRename中文激活版

胖墩儿不胖y

Mac软件 重命名工具 重命名软件

数科公司新动向,借助外部力量寻求增长突破

用友BIP

数科公司

关于亚马逊 CodeWhisperer 的测试反馈

亚马逊云科技 (Amazon Web Services)

#人工智能 云上探索实验室 Amazon CodeWhisperer

为何 DevOps 会给开发人员带来压力和倦怠?

SEAL安全

DevOps 策略 企业号10月PK榜 缺点

用友BIP,赋能被动元器件行业

用友BIP

数智化转型

“PO高阶精进课程” 12月16-17日 · A-CSPO认证周末班【提前报名特惠】

ShineScrum捷行

国外服务器使用经验分享:这些小技巧让你轻松上手

一只扑棱蛾子

国外服务器

VMware Workstation 17安装教程之创建虚拟机

小齐写代码

如何获取私有云硬加密License授权

矩视智能

深度学习 私有云 机器视觉

Redis 7.0 源码调试环境搭建与阅读技巧

码哥字节

redis redis 底层原理

你知道ping命令是如何工作的吗?

百度搜索:蓝易云

Linux 运维 ping ICMP Internet

EMQ 获第八届 “创客中国” 物联网中小企业创新创业大赛一等奖

新消费日报

技术筑生态,智联赢未来 第二届OpenHarmony技术大会即将在京启幕

科技热闻

大模型赛道再添新玩家,快手自研大模型“快意”亮相_生成式 AI_凌敏_InfoQ精选文章