写点什么

“驯服”可控大模型,白海发布一站式大模型微调平台 IDP LM

  • 2023-06-29
    北京
  • 本文字数:1491 字

    阅读完需:约 5 分钟

“驯服”可控大模型,白海发布一站式大模型微调平台IDP LM

ChatGPT 的破圈之旅,拉开了大模型“诸神之战”的序幕,据不完全统计,2020 年至 2023 年间,中国已发布了 79 个参数在 10 亿规模以上的大模型。而仅仅 2023 年前 5 个月,中国以 19 个大模型开发数量位居榜首,国内典型大模型包括:阿里的 M6,百度的文心大模型,华为的盘古,科大讯飞的星火,商汤的日日新,智谱科技的 ChatGLM 等,共同打造完整的中国大模型生态链路。


然而,在大模型如火如荼的背后,幻觉(hallucination)倾向就越发的明显,它正在越发的生产着 “完全没有出处的非真实内容”。这样对于商业化而言是一个巨大的挑战,来面对一个不可控、不可预测和不可靠的大模型。


而对于不同行业、场景和客户来说,大模型要落到垂直细分行业中,才能发挥其应有价值,可控的大模型才是有意义的。为了增强大模型在特定领域或任务上的表现,通常需要对基础大模型进行针对性的高质量微调。然而,如何实现高效和可控的微调是当前行业大模型构建面临的普遍挑战。


白海 IDP(Intelligent Development Platform) LM 致力于帮助客户克服这一挑战,通过提供一站式的大模型微调工具,来“驯服”大模型,实现用低门槛、高效和可控的方式来构建垂直行业专属大模型,具体目标包括为客户提供:

  • 干净、准确的微调训练数据

  • 严格的反馈回流数据审核

  • 全面、综合的模型评估

  • 高效高性能的微调和推理服务


IDP LM 工具化了大模型微调技术(RLHF)的全流程,不仅技术人员,业务人员也可以轻松进行模型微调。同时,IDP LM 提供预训练的领域模型,极大地降低了大模型微调应用的门槛和冷启动成本。除低门槛、低成本外,我们一直坚信,对于大模型在具体行业或场景的应用落地,“可控”是必须的。


在去年 Stable Diffusion 的微调工具构建时,我们就明确了白海的生成式 AI/大模型加速平台的 SQL 目标:即安全可控(Safe)+ 合格(Qualified) + 低成本/低门槛 (Low cost ) 。


“AI 画作《太空歌剧院》为例,这幅画在美术比赛上拔得头筹惊艳四座,但背后生成了 900 多个版本,耗费 80 多个小时,才得到最终的作品。该画基于扩散模型生成,作为潜在变量模型,扩散模型赋予了 AIGC 开放性的创造力,但可控性仍不尽如人意,无法限制在一个具体的预期里,这对商业化会带来很多问题。” 创始人卢亿雷曾表示,”不仅对于 AI 绘画模型如此,大语言模型的行业应用更是面临可控性的挑战。在实际的行业应用中,如金融、医疗等,问答的不可控会带来严峻的后果。“


因此,IDP LM 除了在将大模型微调流程训练工具化外,在数据的处理、数据标注、数据审核和模型评估方面也提供了易用的工具和经验证的高效方法。

  • 在数据清洗和数据增强方面,自动支持数据清洗、同义词替换、随机插入、随机删除、句子重组等。

  • 数据标注方面,我们提供适用于大模型场景的标注工具,如答案质量打分,答案补充,便捷高效的支持数据的标注和数据的训练应用。

  • IDP LM 同时提供自动化的反馈数据回流与应用,这一过程中,对反馈数据的质量审核至关重要。IDP LM 为审核员提供了专门的看板,并基于系统算法提供审核建议和指导,保证反馈回流数据的质量、有效、无害。


大模型的有效评估也是影响模型效果的重要环节。IDP LM 支持自动评估和人工评估,从准确度、安全性、稳定性、领域的专业适用性等角度,对模型效果进行严格把关。IDP LM 目前已在交互式数字人、AI 问诊等领域服务企业客户。我们将继续在重点行业深耕,为客户提供更加简单、易用、完善的大模型构建工具和解决方案支持。


我们始终以“让 AI 更简单、更快速、更高效“的使命为指引,IDP LM 的推出是践行这一使命的重要一步。我们诚挚邀请行业客户和产业链的伙伴和白海 IDP LM 一同,推动大模型在各行业的应用价值创造,驯服可控大模型的为垂直行业及场景所用。

2023-06-29 16:564589
用户头像

发布了 108 篇内容, 共 67.9 次阅读, 收获喜欢 205 次。

关注

评论

发布
暂无评论
发现更多内容

TapData 发布官方性能测试报告,针对各流行数据源,在多项指标中表现拔群

tapdata

数据复制 Tapdata 实时数据集成 tapdata性能测试 性能测试报告

DApp质押挖矿系统开发详细案例及源码部署指南

区块链软件开发推广运营

交易所开发 dapp开发 区块链开发 链游开发 代币阿凯

如何激发下属的工作积极性

老张

团队管理 绩效管理

小程序多端引流技术上的“降本增效”

FinFish

小程序技术 小程序容器技术 小程序多端引流

5 年 “0” 故障,万亿级城商行的非结构化数据底座

XSKY星辰天合

测试开发岗位就业与内推指导公开课

测吧(北京)科技有限公司

测试

dubbo3.0 服务导入导出原理

京东科技开发者

DNS解析常见问题有哪些?DNS解析出现问题怎么解决?

国科云

项目经理把控项目质量真的很难吗?

Hi-CodeCaptain

代码质量 测试覆盖率 精准测试 软件开发、 质量内建

提升需求文档清晰度的实用技巧

爱吃小舅的鱼

需求管理 需求文档 需求沟通

Autodesk Maya 2025 for Mac综合性的三维动画创作软件

Mac相关知识分享

前端技术探秘-Nodejs的CommonJS规范实现原理

京东科技开发者

有php转go项目经验者优先?

王中阳Go

php Go 面试

在昇腾Ascend 910B上运行Qwen2.5推理

SEAL安全

软件测试学习笔记丨Flask操作数据库-数据CRUD(增删改查)

测试人

软件测试 测试开发

CAD迷你看图 for Mac

Mac相关知识分享

数据安全再添保障!TapData 顺利通过 SOC2 Type 2 权威认证

tapdata

数据安全 实时数据平台 数据合规 数据集成工具 soc2type2认证

珂芝双十一AI体验月福利来袭,更有众多新品上新!

科技热闻

KeyShot 2024.3 for mac专业实时渲染和动画软件

Mac相关知识分享

一张网支撑AI端到端应用,哔哩哔哩与华为联袂演绎高维度算网融合

新消费日报

华为云开源时序数据库openGemini:使用列存引擎解决时序高基数问题

华为云开发者联盟

Clickhouse 时序数据库 高基数 openGemini

鸿蒙Flutter实战:01-搭建开发环境

少湖说

flutter 鸿蒙 HarmonyOS NEXT

测试开发岗位就业与内推指导公开课

测试人

软件测试

加锁失效,非锁之过,加之错也

京东科技开发者

东芝音画双芯MiniLED电视Z750NF上市,打造真实影院级视听盛宴

Geek_2d6073

如何应对频繁变更的需求以防项目范围蔓延

爱吃小舅的鱼

需求管理 需求变更 项目范围

Java并发编程知识图谱,掌握并发业务所需的技能点(收藏篇)

肖哥弹架构

Java 并发编程 高并发

Set A Light 3D Studio for Mac开创性的摄影工作室模拟软件

Mac相关知识分享

AI 产品系统的数据指标

采芑

指标中台; 数据分析 AI 基础设施

“驯服”可控大模型,白海发布一站式大模型微调平台IDP LM_生成式 AI_InfoQ编辑部_InfoQ精选文章