写点什么

大模型时代,企业如何打造 AI 数据基础设施?

  • 2023-09-20
    北京
  • 本文字数:3051 字

    阅读完需:约 10 分钟

大小:1.64M时长:09:32
大模型时代,企业如何打造 AI 数据基础设施?

9 月 19 日,AI 基础设施公司 Fabarta 在北京举办首届产品与用户大会,本次大会以“数联世界 智见未来”为主题,汇聚前沿技术与商业洞见,来自学术界、投资界、以及 Fabarta 的客户、合作伙伴、各行业大咖共同分享  AI 赋能业务新范式的多种路径,探讨大模型时代企业如何打造 AI 数据基础设施,迈入真正的全面智能化时代。

构建面向智能应用的数据基础设施

 

当前 AIGC 技术快速发展,企业面临数字化转型和智能化升级的历史机遇。Fabarta 创始人兼 CEO 高雪峰在“数联世界、智见未来”的主题演讲中指出,构建面向智能应用的数据基础设施,是助力企业实现决策智能化的关键所在。

 

Fabarta 构筑了以数据为中心的 AIGC 落地架构范式,围绕着数据以及数据之间的关系(图和向量融合)所代表的企业数据,可以帮助大模型进行推理增强,减少模型的幻觉,实现数据的安全可控,并为其提供长效记忆能力。同时,也可以为其本地数据的 fine-tune 及预训练提供结构化的数据集。此外,作为本地知识库可以不断地进行知识的沉淀,提供可解释的智能,并为 AI Agents 打造核心的数据引擎。

 

Fabarta 创始人兼 CEO 高雪峰表示,Fabarta 不止将数据和数据之间显性、确定的关系记录在数据引擎中,通过向量的距离计算,还可以找到数据之间的丰富的隐含关系,成为了真正 AI 时代可以自生长的有机数据记忆体。 

 

高雪峰强调,Fabarta 致力于打造的是这个时代创新的数据基础设施,希望 Fabarta 的产品,可以帮助万千企业打造核心的面向智能应用的数据基础设施,从而更好,更方便,更加放心地将包括生成式人工智能技术在内的智能技术应用到企业决策智能领域,最终带来业务价值的巨大飞跃。抓住机遇,以数据为核心,构建支持智能化的架构,将是产业变革和发展的关键路径。

 

Fabarta 联合创始人兼 CTO  杨成虎在演讲中深入探讨了企业智能发展的新引擎——多模态智能引擎 ArcNeural。他强调,在强人工智能的背景下,企业知识数据与大型模型之间的互补性,企业私有数据的潜在价值,以及将私有知识与智能应用紧密结合的必要性。

 

杨成虎还详细分享了 ArcNeural 存查算一体的数据管理能力,并结合大模型技术实现智能化、可追溯、可解释的数据洞察能力。ArcNeural 架构面向云原生,并同时支持图与向量的同表管理。此外,在数据计算分析能力基础之上,利用大模型的智能化生成多模态查询计划,以此支持严谨的企业级多模态数据洞察。  最后,他还现场展示了多模态引擎 ArcNeural 结合 ArcFabric、ArcPilot,利用一体两翼范式在 Fabarta 企业内实施的一个 Copilot 系统--Arc42,Arc42 集成了代码、文档、组织关系等多模态数据,协同大模型显著提升企业效能。他表示:“计算 &存储是过去,推理 &记忆才是未来”。

 

Fabarta 联合创始人兼 CPO 仲光庆分享了产品矩阵的设计思路和出发点。Fabarta 经历了从 DB for AI 到大模型时代 AI 基础设施的演进过程。他表示:“当前大模型时代,企业面临从数据、模型到业务落地的全链路挑战,构建融合图数据库和向量数据库的新型数据基础设施,实现数据治理、知识管理和模型记忆,是应对大模型时代的关键。通过低代码平台加速场景化应用落地,企业更关注数据资产与业务价值的产出是智能化新范式,Fabarta 打造的‘一体两翼’产品矩阵,以多模态引擎为基础,数据与 AI 平台为双翼,为企业提供全链路支持,助力企业实现决策智能化”。

AI 时代数据基础设施的学术研究与行业思考

 

会上,Fabarta 科学顾问,国家杰青和优青基金获得者,北京理工大学特聘教授、大数据研究院院长袁野做了“AI 时代数据基础设施新范式的研究与应用”的学术分享。

 

袁教授围绕 AI 视角、数据视角和案例分析三个角度展开讲解,他认为,在 AI 视角,连接主义是模型实现基础,符号系统是高层能力特征,两种基础范式的结合是人工智能发展的必经之路,可以通过图知识增强大模型。 在数据视角,神经符号化的融合方式实现一体化数据管理。通过三个案例分析 —多模态图谱查询、视频数据分析和神经符号数据库,给出 AI 时代数据基础设施新范式的案例参考。

 

随着 AI 时代的技术演进,数据基础设施也在持续更新和迭代中。中国信通院云计算与大数据研究所大数据与区块链部副主任马鹏玮指出,AI 和数据基础设施正在双向奔赴,AI 赋能数据基础设施升级,数据基础设施助力 AI 产业发展。

 

马鹏玮认为,AI 赋能数据基础设施升级,通过数据存算+AI,诞生自治数据库;通过数据管理+AI,诞生智能数据管理工具;通过数据分析+AI :诞生增强型数据分析工具。数据基础设施助力 AI 产业,通过隐私计算、防篡改数据库、全密态数据库和多模态数据编织实现“汇数”,通过向量数据库实现“炼模”,通过图、向量和大模型相结合的技术,实现“用模”。

Fabarta 如何助力企业实现数智化转型?

 

当前,Fabarta 已经通过“一体两翼”产品矩阵帮助金融、制造、医疗等多个行业客户解决业务中的问题,并且成功实施落地。

 

泰康养老作为保险行业头部企业,利用 Fabarta 产品进行数据资产项目落地。 泰康养老数据基建部总经理吴坚平提到,金融保险行业数据资产管理工作中,数据量级爆炸性增长、数据类型多种多样、数据质量需求、数据合规性要求严,数字化建设过程中对于数据资产工具的需求越来越高,亟需智能化工具和产品可以解决以上痛点和问题。

 

通过 Fabarta ArcFabric 产品以及图和 AI 的能力,泰康养老已经构建从数据到资产、从资产到服务的全链路。在数据资源纳管阶段,实现元数据主动采集,利用 ArcGraph 进行血缘分析;利用 AI 技术实现元数据智能补齐、资产智能分类,构建数据资产大图;结合资产运营、资产评估,通过对话式数据看板等方式提供一站式数据资产服务。泰康养老已实现数据资产管理、数据治理与数据研发的协同以及治研一体的管理落地,未来会与 Fabarta 进行数据编织领域更深入的探索和落地。

 

大树科技是专注于智能企服及供应链数字技术的高新技术企业,利用产业链场景数据丰富小微客户画像,通过智能风控手段对客户实现精准的风险分层,实现风险可控的同时为特定产业内的上下游小微客户提供便利的普惠金融服务。大树科技风控和大数据负责人申宇峰带来“图解复杂,洞察价值 图智能助力业务创新”的分享。申宇峰指出,图数据库和图算法的应用已成为金融风控的新趋势,可以通过多跳复杂关系发现隐藏在孤立统计信息背后的关系和价值。

 

申宇峰表示,大树科技利用 ArcGraph 和 ArcPilot 产品,结合海量企业数据和交易数据,构建企业图谱和交易图谱,开展企业图谱业务分析、交易流水分析以及团伙欺诈分析,及时发现关联风险从而有效避免损失。在落地实践中,可以利用 ArcPilot 的图计算能力、灵活可配置画布功能以及行业模版提升图应用开发速度,沉淀图分析场景数据资产。大树科技期待与 Fabarta 进行更多合作和共创,从图智能扩展到大模型与图融合等更多领域。

 

亨通数科是一个面向全球工业装备提供从平台建设、数据应用到知识服务的全栈式产品服务商。亨通数科产品总监董晓健带来 “新一代设备全生命周期管理 — 多模态智能引擎,红海突围的利器”的分享。

 

董晓健指出,“在产品开发中,需要深挖市场需求和设备管理痛点。亨通数科利用 Fabarta ArcNeural 多模态智能引擎,打造新一代设备全生命周期管理软件。多模态智能引擎提供图、向量和大模型融合能力,可以为设备管理从工单录入与生成、设备故障与维修推荐、设备维修知识总结、设备技改方向选择等各环节提供支撑;同时可以利用向量代表的模糊性知识到图代表的确定性知识的转换,实现知识迁移和衍生,已经沉淀的知识可以在不同工厂复制,也可以在不同行业衍生。”

2023-09-20 17:175031

评论

发布
暂无评论
发现更多内容

聊聊测试团队的基础架构建设

老张

质量保障 基础设施建设 基础架构

LED广告机的市场趋势和发展前景

Dylan

媒体 广告 数字 LED显示屏 市场

【网易云信】已开源!网易云信的热点探测平台实践

网易智企

开源 热点探测

用华为云低代码Astro Zero10分钟搭建 “图书馆数据可视化大屏” 应用

华为云PaaS服务小智

软件开发 低代码 华为云

schema registry口令认证配置

Shen-Xmas

kafka Bigdata dba schema schema registry

Gateway 实现网关聚合查询

2756

OSPO才是企业拥抱开源的正确选项——适兕访谈录

开源雨林

开源 OSPO LFAPAC

开源之夏2023中选结果公示,504名高校生将投入开源项目贡献

openEuler

Linux 开源 操作系统 openEuler 实习

英特尔宣布极光超级计算机安装完成,将于2023年末正式上线!

E科讯

科兴未来|中国•湖州海外青创大赛全面开启!

科兴未来News

环保 #双创赛事# 新能源行业 湖州

行业首个多重节律照明!三翼鸟“亮”在哪?

脑极体

智能照明

对线面试官-Redis(内存消耗的问题)

派大星

Java 面试

一文搞定PCB元器件的布局布线

华秋PCB

元器件 PCB 布局 PCB设计 布线

VLDB2023|方略:一个交互式的规则研发系统

AI Infra

程序员 AI 开发者 AI大模型 大模型时代

什么是HTML?

TiAmo

html html5 6 月 优质更文活动

第十四届夏季达沃斯论坛|英特尔王锐:AI驱动工业元宇宙,释放数实融合无穷潜力

E科讯

基于OpenHarmony开发的玻璃拟态天气应用(3)构建天气组件并实现毛玻璃效果

路北路陈

前端 HarmonyOS OpenHarmony应用开发 6 月 优质更文活动

低代码渲染那些事

阿里技术

低代码 渲染

幂律智能联合智谱AI发布千亿参数级法律垂直大模型PowerLawGLM

人称T客

mysql

ltc

MySQL

AIGC+任务管理|给既定目标一个“精准打击”

TE智库

人工智能 任务管理 AIGC 生成式AI

https 原理分析进阶-模拟https通信过程

蓝胖子的编程梦

https TLS SSL证书 ssl SSL/TLS 协议

AIGC+客服|智能客服上岗即失业?AI对话背后的学问大着呢

TE智库

人工智能 智能客服 AIGC 生成式AI

HTML5 游戏开发实战 | 推箱子

TiAmo

html html5 6 月 优质更文活动

(信息化,数字化,智能化)这是三种不同的概念吗?

优秀

数字化 信息化 智能化

inBuilder今日分享丨开源许可协议简介

inBuilder低代码平台

华为云Classroom一站式教学实践平台,开启云端教学新征程

华为云PaaS服务小智

云计算 华为云 线上教学 线上培训

融云出海:TikTok 百亿美元投向东南亚,巨头将如何影响市场格局

融云 RongCloud

产品 运维 出海 市场 通讯

一文读懂火山引擎A/B测试的实验类型(3)——多链接实验

字节跳动数据平台

大模型时代,企业如何打造 AI 数据基础设施?_生成式 AI_凌敏_InfoQ精选文章