写点什么

大模型赛道再添新玩家,快手自研大模型“快意”亮相

  • 2023-08-21
    北京
  • 本文字数:878 字

    阅读完需:约 3 分钟

大模型赛道再添新玩家,快手自研大模型“快意”亮相

近日,快手自研的大语言模型“快意”(KwaiYii)已开启内测,并为业务团队提供了标准 API 和定制化项目合作方案。

 

GitHub 链接:

https://github.com/kwai/KwaiYii

 

据官方介绍,快意大模型(KwaiYii) 是由快手 AI 团队从零到一独立自主研发的一系列大规模语言模型(Large Language Model,LLM),当前包含了多种参数规模的模型,并覆盖了预训练模型(KwaiYii-Base)、对话模型(KwaiYii-Chat)。

 

其中,13B 规模的系列模型 KwaiYii-13B 主要特点包括:


  • KwaiYii-13B-Base 预训练模型具备强大的通用技术支撑能力,在鳄鱼权威的中/英文基准上取得了同等模型尺寸下的 State-Of-The-Art 效果。例如,KwaiYii-13B-Base 预训练模型在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前达到同等模型规模的领先水平。

  • KwaiYii-13B-Chat 对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务,人工评估结果表明 KwaiYii-13B-Chat 超过主流的开源模型,并在内容创作、信息咨询和数学解题上接近 ChatGPT(3.5)同等水平。

 

据介绍,快意大模型(KwaiYii)在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前处于同等模型规模的领先水平,在最新的 CMMLU 中文向排名中,快意的 13B 版本 KwaiYii-13B 同时位列 five-shot 和 zero-shot 下的第一名,在人文学科、中国特定主题等方面较强,平均分超 61 分。

 

KwaiYii-13B-Chat 对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务。


快手方面表示,从人工评估的结果来看,KwaiYii-13B-Chat 超过了同等规模的开源模型,并接近 ChatGPT 同等水平。在内容创作、信息咨询、逻辑推理和数学解题上,基本与 ChatGPT(3.5)效果相当。在多轮对话能力方面,KwaiYii-13B-Chat 超过同等规模的开源模型,但与 ChatGPT(3.5)仍有一定差距。注意:人工评估结果受到评测数据覆盖面、标注主观性等因素的影响,无法全面反映大语言模型的所有能力。



据悉,快手 AI 团队将持续迭代“快意”大模型,一方面将继续优化模型性能并研发多模态能力 ,另一方面也在推进更多 C 端与 B 端业务场景下的落地 。

2023-08-21 11:294456

评论

发布
暂无评论
发现更多内容

6年Java开发经验,面试20多家公司,砍下10多个Offer(附面经分享)

采菊东篱下

Java 编程

DeepSeek 实现任务调度分片算法 , 灵性十足,远超预期 !

采菊东篱下

编程 计算机

WiFi 6 or WiFi 7? Why IPQ9574/IPQ5312 is a Better Choice Than IPQ8072

wifi6-yiyi

WiFi7

锂电池MES系统:全面优化生产流程,提升质量与效率

万界星空科技

制造业 mes 锂电池 新能源电池 锂电池mes

人工智能丨PyTorch 计算机视觉

测试人

软件测试

RocketMQ实战—消息零丢失的方案

EquatorCoco

RocketMQ

首都在线云平台上线DeepSeek-R1系列模型

Geek_2d6073

唯品会商品详情接口(唯品会 API 系列)

tbapi

唯品会商品数据采集 唯品会API 唯品会商品详情接口

软件测试丨静态测试与代码审计

测试人

软件测试

海信e5npro+和小米spro2025款对比

妙龙

海信电视 小米电视

手把手教你将DeepSeek集成到IDEA!开发效率翻了5倍!

架构师之道

编程 AI

音乐 NFT 系统的上线

北京木奇移动技术有限公司

软件外包公司 音乐NFT 体育NFT

多种路径规划方案,满足应用个性化导航需求

HarmonyOS SDK

harmoyos

阿里大牛离职从内部带出的“高并发系统设计”全彩版学习笔记终于开源分享了

架构师之道

Java 编程 高并发

AI产业观察(二):替代地产周期的中国AI周期

ModelWhale

人工智能 AI 大模型 DeepSeek

人工智能丨PyTorch 强化学习与自然语言处理

测试人

软件测试

海尔净省电Pro和美的酷省电区别对比评测

妙龙

美的 海尔

IPQ5018 vs. IPQ4019: Why Industrial WiFi Needs a Performance Boost

wallyslilly

ipq4029 IPQ5010

自研机器人大模型,将是人形机器人创企未来唯一出路!!

机器人头条

机器人 大模型 人形机器人 具身智能

政采云业务网关实践:使用 Higress 统一替代 APISIX/Kong/Istio Ingress

阿里巴巴云原生

阿里云 云原生 Higress

小红书笔记详情 API 接口:获取、应用与收益全解析

科普小能手

数据挖掘 数据分析 小红书 运营干货 API 接口

GaussDB高级压缩,破解业务数据激增难题

华为云开发者联盟

MySQL 数据库 GaussDB 数据压缩

信创算力关键年的三个趋势与最佳选择

脑极体

信创

具身智能领域宝藏私域,您需要的皆在「机器人头条」!!

机器人头条

机器人 大模型 人形机器人 具身智能

海信e5nmini和viddaxmini对比选哪个

妙龙

海信 海信电视

初探集群联邦

天翼云开发者社区

云计算 集群

从传统家电到智能生活,海尔智家的服务治理实践

阿里巴巴云原生

阿里云 云原生

美的风尊二代Pro和酷省电Pro对比

妙龙

美的 空调 美的空调

作业帮P20学习机 评测

妙龙

作业帮 学习机

大模型赛道再添新玩家,快手自研大模型“快意”亮相_生成式 AI_凌敏_InfoQ精选文章