InfoQ Geekathon 大模型技术应用创新大赛 了解详情
写点什么

星环科技入局 AIGC!发布“无涯”“求索”两款大模型

  • 2023-05-29
    北京
  • 本文字数:1365 字

    阅读完需:约 4 分钟

星环科技入局AIGC!发布“无涯”“求索”两款大模型

ChatGPT为代表的超大语言模型的迅速应用,加速了 AI 普及,让 AI 伸手可及,并开始走进大众的工作和生活。毫无疑问,AI 大模型等技术已经深刻地影响到所有行业的发展,并正在重构企业核心产品,重塑用户与企业产品和服务的交互方式。

 

5 月 26 日,星环科技在“向星力·未来数据技术峰会(FDTC)”上发布了金融大模型“无涯”和大数据分析大模型 SoLar“求索”。

 

“无涯”是一款面向金融量化领域、超大规模参数量的生成式大语言模型。无涯使用上百万的专业金融语料,其中涵盖了研报、公告、政策、新闻等高质量的自然语言文本来作为基础大模型的二次预训练语料,使得“无涯”具备对包括基本面、技术面、消息面在内的金融通识领域准确的理解能力。

 

无涯构建了包括政策、舆情、ESG、风险、量价、产业链等六类大模型基础因子集,擅长处理金融量化领域的各类问题,诸如在政策和研报分析、新闻解读、事件总结和演绎推理上都具备强大的理解和生成能力;能够对股票、债券、基金、商品等各类市场事件进行全面的复盘、传播和推演;能够生成另类的策略因子集合,构建立体的归因解释体系。“无涯”大模型通过多模感知+事件驱动+深度图计算,从时间和空间、深度和广度等多个方面扩展了投资研究的视角。

 

SoLar“求索”大模型将作为数据查询和分析的智能助手,为数据工程师、数据科学及业务人员提供更好的使用体验,让非专业用户在不需要学习和掌握数据库编程语言的前提下,就可以通过自然语言自由地按需查询数据。

 

星环科技创始人、CEO孙元浩表示,未来人人都是数据科学家,人类与数据的交互方式将发生重大变革,语言、视频等自然语言的交互方式将逐渐普及,每个人都将需要一个“虚拟业务助手”。

 

ChatGPT 主导的对话式 AI 开始渗透到各行各业,使人和信息结合比以往任何时候都更紧密。然而,超大模型虽好,但是要想训练、维护好一款大模型并不容易。大模型对算法、算力和数据的要求都非常高,因此如果不投入巨大的人力和物力很难有所建树,同时,目前市场现有的通用大模型对于特定领域的适用性表现也不佳。

 

为此,除了上述两大模型外,为了帮助企业用户基于大模型构建未来应用,星环科技推出了 Sophon LLMOps,帮助企业构建自己所在垂直领域的大模型。

 

作为一个机器学习模型全生命周期管理的工具平台,星环Sophon LLMOps 针对大语言模型及其衍生数据、模型、应用问题,提供了相应的增强,形成了 LLMOps 的工具链:

 

首先是样本仓库能力。覆盖训练数据开发、推理数据开发、数据维护等工作,对大语言模型涉及的原始数据、样本数据、提示词数据做清洗、探索、增强、评估和管理。

 

第二,模型运维管理能力。除了传统 MLOps 的六大统一——统一纳管、统一运维、统一应用、统一监控、统一评估、统一解释外,针对大语言模型的微调、持续提升、评估、对齐等提供从计算框架、工具到计算、存储、通信的调度和优化支持。

 

第三,大语言模型和其他任务的编排和调度和上线能力。星环 Sophon LLMOps 提供 Agent、Ops、DAG,结合星环的多款大数据、数据库产品,如向量数据库 Hippo 和星环分布式图数据库 StellarDB 等,将不同大语言模型、传统机器学习、其他流程等编排成符合用户实际领域和业务需求的任务,并为客户提供服务。

 

孙元浩预测,未来数据处理将走向智能化、多模态和平民化。让普通人不再需要掌握复杂工具,就可以快速处理数据,这是数据处理平民化的一大追求。

 

活动推荐:

2023年9月3-5日,「QCon全球软件开发大会·北京站」 将在北京•富力万丽酒店举办。此次大会以「启航·AIGC软件工程变革」为主题,策划了大前端融合提效、大模型应用落地、面向 AI 的存储、AIGC 浪潮下的研发效能提升、LLMOps、异构算力、微服务架构治理、业务安全技术、构建未来软件的编程语言、FinOps 等近30个精彩专题。咨询购票可联系票务经理 18514549229(微信同手机号)。

2023-05-29 18:272806
用户头像
李冬梅 加V:busulishang4668

发布了 661 篇内容, 共 255.2 次阅读, 收获喜欢 818 次。

关注

评论

发布
暂无评论
发现更多内容

架构实战-毕业设计

程序员小张

「架构实战营」

国产游戏引擎,竟然用来搞民航

Openlab_cosmoplat

人工智能 开源

车载手势识别技术:未来交通的革命性解决方案

来自四九城儿

行业分析| 快对讲-融合会议的应用

anyRTC开发者

音视频 视频会议 快对讲 融合会议 电话会议

一文看懂数据云平台的“可观测性”技术实践

科技热闻

iTubeGo YouTube Downloader 快速下载视频~

真大的脸盆

Mac 视频下载 网页视频下载 Mac 软件 下载视频

如何用一行代码实现监测 OpenAI,大幅提升使用体验

Yestodorrow

可观测性 用户体验 应用性能 ChatGPT

软件测试丨Python学习笔记之内置库科学计算、日期与时间处理

测试人

Python 软件测试 测试开发

ChatGPT:DevSecOps 落地实践的最后一公里

极狐GitLab

DevOps 云原生 Code Review DevSecOps ChatGPT

低代码开发——进最热的赛道,啃最硬的骨头

引迈信息

前端 低代码 快速开发 JNPF

SRE方法论之拥抱风险

不思jo

#运维

基于HTML5智慧产业园三维可视化运维平台

2D3D前端可视化开发

物联网 数字孪生 三维可视化 工业组态 智慧产业园区

量化交易系统开发——现货策略

薇電13242772558

量化策略

实践「容器镜像扫描」,Get 云原生应用的正确打开方式

极狐GitLab

Docker DevOps 云原生 DevSecOps 容器镜像

Vue3迎来升级,全面助力企业数字化转型

引迈信息

Arb链发币详细教程,3分钟学会在Arbitrum上部署智能合约

加密先生

【换模型更简单】如何用 Serverless 一键部署 Stable Diffusion?

Serverless Devs

云计算 Serverless AIGC

inBuilder低代码平台开发者分享课丨提交PR的正确姿势

inBuilder低代码平台

在研制带处理器的电子产品时,如何提高抗干扰能力和电磁兼容性?

华秋PCB

电磁 电路 处理器 控制器 抗干扰

火山引擎DataLeap:3步打造“指标管理”体系,幸福里数据中心是这么做的

字节跳动数据平台

大数据 字节跳动 数据管理 指标管理 数据研发

什么是微信朋友圈广告?朋友圈广告怎么投放?怎么收费的?

吴老师讲业

互联网广告 广告业 微信朋友圈 朋友圈

低代码让软件开发不再复杂

这我可不懂

软件开发 低代码 JNPF

大家都在用的6大类18款企业协同办公软件盘点

PingCode

项目管理软件 研发管理软件 文档协同软件

腾讯安全携手行业伙伴,详解攻击面管理(ASM)技术的“拓客”潜力

Geek_2d6073

腾讯云首发多款领先新品,TDSQL全新特性助力国产化替代提速

科技热闻

保密+完整+可用+安全,规避代码安全「马奇诺防线」,构建软件供应链整体安全

极狐GitLab

高可用 DevSecOps geo 代码安全 软件供应链安全

ChatGPT到来个人如何应对

不焦躁的程序员

人工智能 职业成长

火山引擎DataTester分享:A/B实验中常见的8个错误

字节跳动数据平台

Web3和低代码开发:下一代Web应用开发的合作与创新

加入高科技仿生人

前端 Web 低代码

让算力不再成为瓶颈,小红书机器学习异构硬件推理优化之道

小红书技术REDtech

机器学习 架构 异构计算

操作系统国产化步入深水区,小程序技术助力生态搭建

FinClip

  • 扫码添加小助手
    领取最新资料包
星环科技入局AIGC!发布“无涯”“求索”两款大模型_AI_李冬梅_InfoQ精选文章