写点什么

William McKnight 关于数据平台和创建现代数据架构的见解

  • 2018-10-28
  • 本文字数:999 字

    阅读完需:约 3 分钟

在上周举行的数据架构 2018 年峰会上,William McKnight 就使用不同的数据平台创建现代数据架构做了主旨演讲

他以讨论组织的数据成熟度和业务成功之间的高度相关性开始了他的演讲。组织的数据架构越成熟,业务就越成功。成熟度较低的组织往往会把数据分散于不同的信息孤岛中。他分享了一些来自 2018 年“互联网分钟(Internet Minute)”中所发生的事情的统计数据,在互联网上每分钟发送 1 亿 8700 万封电子邮件和 1800 万条短信,进行 370 万次搜索查询等等。

人工智能(AI)是一股颠覆性的力量,而数据则是这场革命的基石。行业中出现了新的数据集:生物数据(Bio Data)。如果将生物数据和环境数据(如位置等)结合在一起,那么你将拥有进行数据分析的所有信息。

他谈到了数据培养和像数据仓库(data warehouse)和数据湖(Data Lake)这样的解决方案如何帮助完成数据工作。数据架构师也需要在 HDFS 和云存储之间做出选择。HDFS 具有更好的查询性能,而云存储的扩展性、持久性和可用性更好,并且成本更低。

通过比较关系数据库和 nosql 数据库的数据大小和工作负载复杂性,McKnight 讨论了即可使用的大数据平台的选择。

另外,他也谈到了 NewSQL 数据库,该数据库可扩展、兼容 ACID 并支持分片。这些数据库正被用于资本市场数据输入、金融交易、电信记录流和欺诈检测。

数据库的云部署提供了一些好处,包括按需和自助服务数据管理、广泛的网络访问、资源汇集、快速弹性和可测量的服务。

传统的 ETL 技术不足以用于企业范围内运行的数据平台。有各种各样的数据源,并且数据是实时流式传输的。数据架构应该考虑这些需求的流处理

企业数据虚拟化提供了对所有结构化和半结构化数据持续及时的访问,这些数据来自组织内不同的数据源,如数据仓库、市场、多维数据集、操作数据存储(operational data stores,简称 ODS)、事务源和文件系统。

他建议,数据专业人员在这次数据架构转型旅程中进行他们的挑战,应该做好进行长期战役的准备,可能会失败几次才能最终获得成功。将您的数据体系结构工作与应用程序预算和路线图项目结合起来,以便在数据架构实施方面取得进展。

McKnight 对其演讲进行了总结,建议数据专业人员在需要高性能的数据管理解决方案的地方考虑使用内存数据库,并考虑未来使用 GPU 数据库和混合数据库。

阅读英文原文: William McKnight on Data Platforms and Creating a Modern Data Architecture

感谢冬雨对本文的审校。

2018-10-28 04:081174
用户头像

发布了 199 篇内容, 共 86.6 次阅读, 收获喜欢 295 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

这样准备面试定能轻松斩获 offer!(内附精选 java 面试题与答案)

架构师之道

Java 编程 面试

Bonree ONE荣膺广东省CIO协会“2024优秀解决方案”奖!

博睿数据

Spring Boot + 规则引擎 URule,太强了!

架构师之道

Java 编程

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

阿里巴巴云原生

阿里云 云原生 nacos

推荐几个不错的 Linux 服务器管理工具

不在线第一只蜗牛

Linux 运维 服务器

Finovy 国际数据中心公网互联新突破,直连 Huawei Cloud与 Apple!

Finovy Cloud

数据中心 ISP

火语言RPA轻松开发控制台程序或带界面交互的客户端应用

火语言RPA

RPA 自动化 低代码 影刀RPA 火语言

铝杆加工行业:从生产流程到智能化管理-MES系统解决方案全解析

万界星空科技

制造业 mes 铝杆加工 铝业 铝杆加工行业

探索微店商品详情API接口:解锁高效电商管理的关键工具

代码忍者

微店商品详情API接口

7.5.4 MVCC优化测试

TiDB 社区干货传送门

7.x 实践

BladeDISC++:Dynamic Shape AI 编译器下的显存优化技术

阿里云大数据AI技术

人工智能 分布式 PAI BladeDISC++

Envoy 开启 HTTP2 后偶现 404 如何解决?

阿里巴巴云原生

阿里云 云原生 envoy

Zabbix agent2 自定义SQL监控和告警实施指南:针对TiDB数据库

TiDB 社区干货传送门

监控 实践案例 管理与运维

远程办公对社交关系的深层影响及多元应对策略

柳岸风吟

1688平台API商品详情和关键词搜索:深入探索批发电商数据的钥匙

代码忍者

1688API接口

晨曦中的山林

柳岸风吟

G1原理—如何优化G1中的MGC

EquatorCoco

Java JVM

黄东旭:2025 数据库技术展望

PingCAP

数据库 TiDB

数禾科技:资源成本降低 50%!用 TiDB 实现技术栈简化的实践和收益

PingCAP

数据库 TiDB

新项目如何开展测试工作

老张

项目管理 软件测试 质量保障

简化Maven项目依赖:优雅去除未使用Jar包

采菊东篱下

编程 计算机

金三银四面试必备,吃透2025全新突击真题宝典,阿里腾讯字节都稳了

采菊东篱下

Java 编程 面试

云主机 vs 轻量型云主机:性能与灵活性的平衡

天翼云开发者社区

云计算 云主机 云主机厂商

DNS解析中的TTL值是什么意思?怎么设置合适?

国科云

阿里巴巴API接口对电商的影响与收益

科普小能手

数据挖掘 阿里巴巴 数据分析 电商 API 接口

和鲸科技受邀出席 2024(第四届)“风电领跑者”技术创新论坛

ModelWhale

人工智能 大数据 AI 风电

TiDB 工具 | PD全部扩缩容替换注意事项

TiDB 社区干货传送门

实践案例 集群管理 管理与运维 故障排查/诊断 扩/缩容

QCN9074 Series WiFi Modules Game-Changer in Wireless ech: Now Support 5MHz/10MHz Bandwidth!

wifi6-yiyi

wifi network card

远程教学在高等教育中的应用与挑战

柳岸风吟

解读TaurusDB字段压缩:减少存储成本,避免语句大量修改

华为云开发者联盟

Lynx TiDB 慢日志收集工具

TiDB 社区干货传送门

性能调优

William McKnight关于数据平台和创建现代数据架构的见解_服务革新_Srini Penchikala_InfoQ精选文章