QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

微软 Fabric 正式发布,面向人工智能时代的数据分析

  • 2023-06-06
    北京
  • 本文字数:2744 字

    阅读完需:约 9 分钟

微软Fabric正式发布,面向人工智能时代的数据分析

近日,微软推出了微软 Fabric 国际版——一个端到端的统一数据分析平台,汇集了企业需要的所有数据和分析工具。Fabric 将 Azure 数据工厂Azure Synapse Analytics 和 Power BI 等技术集成到一个统一的产品中,能够让数据和业务专员更好地发掘、探索企业的数据,也为人工智能时代的到来奠定了基础。


人类正在进入由人工智能定义的新时代,数据的重要性愈发不言而喻。人工智能的应用正在融入工作中的方方面面,重新定义工作方式,这更需要纯净的数据与高度集成的分析系统进行支撑。然而,大多数企业正在使用的数据分析系统却像迷宫一样复杂。


这并不令人意外,因为大数据和人工智能技术市场高度分散,拥有数百个供应商和成千上万种服务。客户需要自行整合这些来自不同供应商的、彼此独立的服务,还要承担让这些服务协同运行的成本。


Fabric 是一个端到端的分析平台,涵盖了组织在数据分析中各个方面的需求。而下面这五个方面的特点,让 Fabric 在市场中脱颖而出:

Fabric 是一个完整的分析平台


每个分析项目都有多个子系统,每个子系统需要不同的能力组合,通常需要使用来自多个供应商的产品。集成这些产品的过程可能会非常复杂、不稳定且昂贵。 


有了 Fabric,客户只需要使用这一款产品,它具有一体化的用户体验和架构,提供了开发人员从数据中提取有价值信息并最终呈现给用户所需要的所有功能。通过自动集成和优化所有内容,提供独特的用户体验,用户只需用几秒钟注册,就可以体验其中蕴含的商业价值。



Fabric 为不同角色的团队成员提供了符合其需求的特定体验,因此无论是数据工程师、数据仓库专员、数据科学家、数据分析师、还是业务用户,都能得心应手地使用 Fabric。

Fabric 是以数据湖为核心的开放平台


数据湖非常混乱且复杂,用户难以创建、整合、管理和操作。而且,一旦数据湖开始运行,使用不同数据格式的不同数据产品部署在同一个数据湖中,可能会导致严重数据重复以及企业对供应商的依赖。


OneLake 数据的 Onedrive


Fabric 内置了一款叫做 OneLake 的多云数据湖,所有 Fabric 都可直接使用。所有 Fabric 的工作都会自动与 OneLake 连接,就像所有的 Microsoft 365 应用程序与 OneDrive 连接一样。数据会在一个直观的数据中心进行组织,并自动建立索引,以供发现、共享、治理和进行合规性管理。


OneLake 同时为开发人员、业务分析师和业务用户提供服务,有助于消除因为不同开发人员自行配置和管理自己的独立存储账户而造成的数据孤岛现象。OneLake 为所有开发人员提供了一个单一、统一的存储系统,在该系统中,数据的发现和共享会变得更容易,并可以通过集中执行的策略和安全设置来管理。


OneLake 的一个关键功能是“快捷方式(Shortcuts)”。OneLake 允许用户和应用程序在不必要地移动和复制信息的情况下轻松共享数据。快捷方式使得 OneLake 可以在 ADLSg2Amazon Simple Storage Service (Amazon S3)和 Google Storage(即将推出)中虚拟化数据湖存储,使开发人员能够跨云平台组合和分析数据。


采用开放的数据格式进行分析


Fabric 在所有的工作和层面上都致力于采用开放的数据格式。Fabric 将 Delta 和 Parquet 文件视为原生数据格式,并将其作为所有工作的默认格式。这种对共同开放数据格式的坚持意味着客户只需将数据加载到数据湖中一次,所有的工作都可以在同一份数据上操作,而不需要单独导入数据。这也意味着 OneLake 支持任何格式的结构化数据和非结构化数据,为客户提供了灵活的选择。


通过将 OneLake 作为我们的存储系统,并将 Delta 和 Parquet 作为所有工作的通用格式,我们为客户提供了在最基本层面上统一的数据堆栈。客户不需要为数据库、数据湖、数据仓库、商业智能或实时分析维护不同的数据副本。相反,在  OneLake  中只需要维护一份数据副本,就可以直接为所有工作提供支持。


对于客户来说,在不同数据引擎之间管理数据安全(表级、列级和行级)可能会很痛苦。Fabric 提供了一个通用的安全模型,该模型在 OneLake 中进行管理,并且所有引擎在处理查询和作业时会统一执行这个模型。这一模型即将发布。

Fabric 是以人工智能技术驱动的平台


Fabric 在各个层面都融入了 Azure OpenAI 服务,旨在帮助客户充分发掘其数据的潜力,使开发人员能够利用人工智能技术对其数据进行分析,并帮助业务用户深入了解数据。在 Fabric 的数据体验中,通过 Copilot,用户可以使用对话式语言来创建数据流和数据管道、生成代码和完整的函数、构建机器学习模型或可视化结果。客户甚至可以创建自己的对话式语言体验,将 Azure OpenAI  服务模型与其数据相结合,并将其作为插件发布。


Fabric 的 Copilot 建立在我们对企业数据安全和隐私的现有承诺的基础上。Copilot 会集成组织的安全、合规和隐私政策。微软承诺不会使用用户数据来训练支持 Copilot 的基础语言模型。

Fabric 为所有角色赋能


客户希望在企业中建立数据文化,使每个人都能基于数据做出更好的决策。为了帮助客户培养这种文化,Fabric 与人们每天都使用的 Microsoft 365 应用程序进行了深度集成。


Power BI 是 Fabric 的核心组成部分,并已经在 Microsoft 365 中广泛应用。通过 Power BI 与诸如 Excel、Microsoft Teams、PowerPoint 和 SharePoint 等流行应用程序的深度集成,用户可以轻松地从 Microsoft 365 中发现和访问来自 OneLake 的相关数据,帮助客户从数据中获得更多的价值。这样的集成使用户能够在他们已经熟练使用的 Microsoft 365 工具中直接访问和分析数据,提高了数据的可发现性和可用性,帮助客户充分发挥数据的潜力,从而推动其业务获得更大的价值。

Fabric 通过统一容量降低成本


目前的分析系统通常会将来自多个供应商的产品组合在一个项目中。这导致计算的资源在数据集成、数据工程、数据仓库和商业智能等多个系统中进行分配。当其中一个系统处于空闲状态时,其算力无法被其他系统利用,从而造成了巨大的资源浪费。


Fabric 极大地简化了购买和管理资源。客户可以购买一种能够为所有 Fabric 工作供能的算力池。采用这种全包的方式,客户可以自由地创建解决方案,整合各种工作,而不需要面临复杂的集成或协调问题。统一的算力容量大大降低了成本,因为任何一个工作负载中未使用的算力都可以被其他工作负载利用。这种统一容量的使用方式使资源的利用更加高效,从而最大程度地降低了成本。


Fabric 目前处于海外版预览阶段。用户可以通过注册免费试用 Fabric 海外版来体验 所有功能。每个注册用户都可以获得固定的 Fabric 试用容量,可用于集成数据、创建机器学习模型等任何功能。现有的 Power BI Premium 客户可以通过 Power BI 管理门户启用 Fabric。2023 年 7 月 1 日后,Fabric 将对所有 Power BI 租户启用。点击链接,即可报名注册免费试用微软 Fabric。


Microsoft Build 中国即将来袭,更多精彩等你来参与,扫描下方二维码即可参与报名



2023-06-06 11:5911391

评论

发布
暂无评论
发现更多内容

质量体系建设之路的分分合合

声网

创业讲堂 生态专栏

服务线上治理

阿泽🧸

微服务 7月月更

TLA+ 入门教程(1):形式化方法简介

多颗糖

分布式系统 TLA+

C语言中sizeof操作符的坑

Albert Edison

c++ C语言 7月月更 sizeof

智洋创新与华为签署合作协议,共同推进昇腾AI产业持续发展

Geek_2d6073

广电五舟与华为签署合作协议,共同推进昇腾AI产业持续发展

Geek_2d6073

浅聊一下中间件

为自己带盐

中间件 7月月更 dotnetcore

后CentOS时代的操作系统漫谈

冯骐

centos 开源 openEuler 国产化 Anolis

赋能数字经济 福昕软件出席金砖国家可持续发展高层论坛

联营汇聚

leetcode 72. Edit Distance 编辑距离(中等)

okokabcd

LeetCode 动态规划 算法与数据结构

【算法社区】训练准备和复杂度分析

小明Java问道之路

数据结构 算法 LeetCode 7月月更 算法社区

可观测|时序数据降采样在Prometheus实践复盘

阿里巴巴云原生

阿里云 云原生 Prometheus 可观测

跨域请求

Jason199

跨域 7月月更

使用 BlocConsumer 同时构建响应式组件和监听状态

岛上码农

flutter ios 安卓 移动端开发 7月月更

HUAWEI nova 10系列发布 华为应用市场筑牢应用安全防火墙

最新动态

【愚公系列】2022年7月 Go教学课程 003-IDE的安装和基本使用

愚公搬代码

7月月更

认识ThreadPoolExecutor

zarmnosaj

7月月更

玩转gRPC—深入概念与原理

闫同学

gRPC 网络协议 后端开发

2022-Java后端工程师面试指南-(Java基础篇)

自然

Java’ 7月月更

牛客java选择题每日打卡Day6

京与旧铺

7月月更

Vuex(三)

小恺

7月日更

能源势动:电力行业的碳中和该如何实现?

脑极体

【Docker 那些事儿】容器为什么傲娇?全靠Hub撑腰

Albert Edison

7月月更

算法入门很简单:链表题套路及精选题目

宇宙之一粟

链表 7月月更

可视化任务编排&拖拉拽 | Scaleph 基于 Apache SeaTunnel的数据集成

Apache SeaTunnel

数据同步 数据集成 可视化开发 数据集成平台 拖拉拽

湘江鲲鹏加入昇腾万里伙伴计划,与华为续写合作新篇章

Geek_2d6073

蓝队攻防演练中的三段作战

穿过生命散发芬芳

攻防演练 7月月更

HPDC智能基座人才发展峰会随笔

乌龟哥哥

7月月更

图解网络:什么是网关负载均衡协议GLBP?

wljslmz

网络协议 7月月更 GLBP 图解网络 网关负载均衡协议

关于栈区、堆区、全局区、文字常量区、程序代码区

NewBoy

前端 移动端 iOS 知识体系 7月月更

繁华落尽、物是人非:个人站长该何去何从

石头IT视角

微软Fabric正式发布,面向人工智能时代的数据分析_AI&大模型_微软中国_InfoQ精选文章