写点什么

国产开源大模型阵营又添新成员!商汤科技发布新一代大语言模型书生·浦语 2.0,支持 200K 超长上下文

  • 2024-01-18
    北京
  • 本文字数:1019 字

    阅读完需:约 3 分钟

大小:356.42K时长:02:01
国产开源大模型阵营又添新成员!商汤科技发布新一代大语言模型书生·浦语2.0,支持200K超长上下文

1 月 17 日,商汤科技与上海 AI 实验室联合香港中文大学和复旦大学正式发布新一代大语言模型书生·浦语 2.0(InternLM2)。

 

InternLM2 是在 2.6 万亿 token 的高质量语料上训练得到的。沿袭第一代书生·浦语(InternLM)设定,InternLM2 包含 7B 及 20B 两种参数规格及基座、对话等版本,满足不同复杂应用场景需求,

 

沿袭第一代书生·浦语(InternLM)的设定,InternLM2 包含 7B 及 20B 两种参数规格及基座、对话等版本,满足不同复杂应用场景需求,分别是:

 

  • Internlm2-base: 高质量和具有很强可塑性的模型基座,是模型进行深度领域适配的高质量起点;

  • Internlm2: 在 internlm2-base 基础上,在多个能力方向进行了强化,在评测中成绩优异,同时保持了很好的通用语言能力;

  • Internlm2-sft:在 Base 基础上,进行有监督的人类对齐训练;

  • Internlm2-chat:在 internlm2-sft 基础上,经过 RLHF,面向对话交互进行了优化,具有很好的指令遵循、共情聊天和调用工具等的能力。


InternLM2 的基础模型具备以下的技术特点:

 

  • 有效支持 20 万 tokens 的超长上下文:能够一次性接受并处理约 30 万汉字(约五六百页的文档)的输入内容。

  • 综合性能全面提升:各能力维度相比上一代模型全面进步,在推理、数学、代码等方面的能力提升显著。

 

值得一提的是,书生·浦语 2.0 版本将继续开源,提供免费商用授权。

 

Github 地址:

https://github.com/InternLM/InternLM

 

模型相关链接:

目前,书⽣·浦语 2.0(InternLM2)系列模型现已在魔搭 ModelScope 社区开源,包括:

 

书生·浦语 2-7B:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-7b/summary

书生·浦语 2-对话-7B:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-chat-7b/summary

书生·浦语 2-基座-7B:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-base-7b/summary

书生·浦语 2-对话-7B-SFT:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-chat-7b-sft/summary

书生·浦语 2-基座-20B:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-base-20b/summary

书生·浦语 2-20B:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-20b/summary

书生·浦语 2-对话-20B:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-chat-20b/summary

书生·浦语 2-对话-20B-SFT:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-chat-20b-sft/summary

2024-01-18 17:587383
用户头像
李冬梅 加V:busulishang4668

发布了 1004 篇内容, 共 617.7 次阅读, 收获喜欢 1178 次。

关注

评论

发布
暂无评论
发现更多内容

资源有限?如何低成本开发体育直播平台,吸引用户并持续互动!

软件开发-梦幻运营部

拥抱数智化,JNPF低代码平台如何推动企业转型升级

快乐非自愿限量之名

低代码 数智化

通义灵码怎么样?分为哪些版本,看看基础能力多少分?

阿里云云效

阿里云 云原生 通义灵码

电商数据抓取新技能:京东商品详情API返回值分析

技术冰糖葫芦

api 网关 API Explorer API 策略 pinduoduo API

消费全返免单系统模式开发技术讲解

V\TG【ch3nguang】

中国传媒业人工智能应用发展图谱2024

易观分析

人工智能’

数据可视化伙伴:天谋科技与图扑物联完成兼容性互认证

Apache IoTDB

API 网关 OpenID Connect 实战:单点登录(SSO)如此简单

阿里巴巴云原生

阿里云 云原生 Higress

双良集团:打造智能制造数字化管控平台,实现精细化管理

用友BIP

揭秘丨主数据管理的创新蜕变

用友BIP

大学生必备!华为手机校园智慧锦囊,一机在手,万事无忧

最新动态

奇绩创坛 2025 春季创业营开始报名

奇绩创坛

奇绩创坛 奇绩创坛创业营

IoTDB 端边云同步:SQL 一键搞定 5 大常见场景

Apache IoTDB

易观分析:2024年第2季度中国电商直播市场交易规模达10604亿元 退货问题折射行业转型急迫性

易观分析

电商直播

LLM应用实战: 产业治理多标签分类

不在线第一只蜗牛

LLM

NFC碰一碰刷卡、AI功能……2024年大学生都在关注手机哪些功能?

最新动态

这应该是全网最详细的Vue3.5版本解读

快乐非自愿限量之名

JavaScript Vue 前端

IPQ5332: Power Efficiency with 320 MHz Channel Width

wallyslilly

IPQ5332

自增主键去哪了?---一次开发过程中的思考

京东零售技术

后端 自增主键

西游再现!一键部署 Flux 文生图大模型生成西游人物

阿里巴巴云原生

阿里云 云原生

数业智能心大陆告诉你如何培养孩子的批判性思维?

心大陆多智能体

智能体 AI大模型 心理健康 数字心理

低代码提升开发能力的思路

伤感汤姆布利柏

数业智能心大陆:揭秘如何利用AI做心理疗愈

心大陆多智能体

智能体 AI大模型 心理健康 数字心理

AI+制造:助力制造企业转型升级

用友BIP

通义灵码怎么样?分为哪些版本,看看基础能力多少分?

阿里巴巴云原生

阿里云 云原生 通义灵码

蚂蚁数科发布智能数据开发与治理平台DataFab 加速数据要素价值释放

Lily

奖项再+1!通义灵码智能编码助手通过可信 AI 智能编码工具评估,获当前最高等级

阿里巴巴云原生

阿里云 云原生 通义灵码

奖项再+1!通义灵码智能编码助手通过可信 AI 智能编码工具评估,获当前最高等级

阿里云云效

阿里云 云原生 通义灵码

三分钟全面了解低代码,两小时实现应用系统搭建

EquatorCoco

低代码 系统搭建

功能发布-自定义SQL查询

ClkLog

sql 开源 自定义标签

他们正在体验用友BIP超级版AI新利器

用友BIP

国产开源大模型阵营又添新成员!商汤科技发布新一代大语言模型书生·浦语2.0,支持200K超长上下文_生成式 AI_李冬梅_InfoQ精选文章