免费下载!由 O’Reilly 出版的《NGINX 完全指南》中文版已正式上线 了解详情
写点什么

Amazon Redshift Spectrum 将数据仓库扩展到 EB 级别且无需加载(二)

  • 2020-01-16
  • 本文字数:1085 字

    阅读完需:约 4 分钟

Amazon Redshift Spectrum 将数据仓库扩展到 EB 级别且无需加载(二)
## 专为提高性能和节约成本而设计


利用 Amazon Redshift Spectrum,您只需为对您实际扫描的数据所运行的查询付费。我们建议您利用文件分区、列数据格式和数据压缩来最大程度降低在 Amazon S3 中扫描的数据量。这对于数据仓库非常重要,因为它可以显著提高查询性能和降低成本。通过按日期、时间或任何其他自定义键对 Amazon S3 中的数据进行分区,Redshift Spectrum 可以动态修剪不相关的分区以最大程度降低要处理的数据量。如果您以列格式(例如 Parquet)存储数据,Redshift Spectrum 将仅扫描查询所需的列,而不会处理整个行。同样,如果使用 Redshift Spectrum 支持的一种压缩算法来压缩数据,则可以减少扫描的数据量。
Amazon Redshift 和 Redshift Spectrum 提供各自同类产品中更好的功能。如果需要对相同的数据频繁运行查询,您可以将其标准化并存储到 Amazon Redshift 中,然后利用功能完备的数据仓库的所有优势来以固定费率存储和查询结构化数据。同时,您可以将其他数据(无论是历史数据还是最新数据)继续以多种开放格式保留在 Amazon S3 中,并将 Amazon Redshift 查询扩展到 Amazon S3 数据湖中。
这就是 Amazon Redshift Spectrum 将数据仓库扩展到 EB 级别且无需加载的方法。Redshift 将终结“‘或’暴政”,使您可随时在所需位置、按所需格式存储数据,并在需要时使这些数据可供使用标准 SQL 进行快速处理。
---
### 其他阅读资源
[](https://amazonaws-china.com/blogs/big-data/10-best-practices-for-amazon-redshift-spectrum/) [](https://amazonaws-china.com/blogs/big-data/amazon-quicksight-adds-support-for-amazon-redshift-spectrum/) [](https://amazonaws-china.com/blogs/aws/amazon-redshift-spectrum-exabyte-scale-in-place-queries-of-s3-data/)
![](https://d2908q01vomqb2.awsstatic-china.com/b6692ea5df920cad691c20319a6fffd7a4a766b8/2017/06/16/spectrum_top_10_2-300x167.gif)


---
复制代码


作者介绍:


**![](https://d2908q01vomqb2.awsstatic-china.com/b6692ea5df920cad691c20319a6fffd7a4a766b8/2017/07/20/maor_100.jpg)Maor Kleider** 是快速、简单、经济高效的数据仓库 Amazon Redshift 的高级产品经理。Maor 热衷于与客户和合作伙伴之间的合作,了解他们独特的大数据用例并进一步改善其体验。在空闲时间,Maor 喜欢与家人一起旅行和探索新美食。
复制代码


TAGS:


Amazon Redshift


,


Amazon Redshift Spectrum


,


数据湖


本文转载自 AWS 技术博客。


原文链接:https://amazonaws-china.com/cn/blogs/china/amazon-redshift-spectrum-extends-data-warehousing-out-to-exabytes-no-loading-required/


2020-01-16 10:07418

评论

发布
暂无评论

RabbitMQ不讲武德,发个消息也这么多花招,nginx实现负载均衡原理

Java 程序员 后端

【架构实战营】模块三

Henry | 衣谷

架构实战营

Redis分布式锁的原理以及如何续期,java程序设计实验实训教程答案

Java 程序员 后端

Redis常用命令总结,java项目实例教程详细

Java 程序员 后端

Netty相关面试题汇总,java从入门到精通第五版电子书下载微盘

Java 程序员 后端

OpenYurt v0,linuxshell学习

Java 程序员 后端

Nginx服务不行了怎么办,网商银行java面试

Java 程序员 后端

Red5搭建直播平台,java淘宝客教程

Java 程序员 后端

Netty进阶:手把手教你如何编写一个NIO服务端(1),Java笔试常见编程题

Java 程序员 后端

new-Object()到底占用几个字节,看完这篇彻底明白了!,springboot微服务架构书籍

Java 程序员 后端

Redis、MongoDB及Memcached的区别,老男孩linux运维54期视频

Java 程序员 后端

redis数据迁移之redis-shake,java高级技术经理面试题

Java 程序员 后端

RocketMQ ACL版本升级过程中的曲折经历(大厂线上环境大规模MQ升级开启ACL实战)

Java 程序员 后端

Netty进阶:手把手教你如何编写一个NIO服务端,java集合容器面试

Java 程序员 后端

OpenFaaS实战之二:函数入门,mysql集群数据同步原理

Java 程序员 后端

Redis的各种用途以及使用场景,mybatis技术原理

Java 程序员 后端

Peter-Java 8中的Lambda表达式,java领域的相关技术领域

Java 程序员 后端

Redis 配置文件重要属性介绍,java面试项目经验

Java 程序员 后端

Redis-数据库、键过期的实现,跟面试官侃半小时MySQL事务隔离性

Java 程序员 后端

Redis持久化--Redis宕机或者出现意外删库导致数据丢失--解决方案

Java 程序员 后端

Netty权威指南:I-O-多路复用技术,java技术点总结

Java 程序员 后端

Redis-中会涉及那么多数据结构,那你数据对象的底层实现方式你都了解吗?

Java 程序员 后端

Redis源码剖析——客户端和服务器,springboot入门程序

Java 后端

Netty案例介绍-群聊案例实现,java架构师教程百度云

Java 程序员 后端

Redis应用之缓存实现,java异步编程实战pdf

Java 程序员 后端

Oracle最新的Sql笔试题及答案,Java面试真题解析火爆全网

Java 程序员 后端

P8级大佬整理在Github上45K+star手册,吃透消化,java算法面试题及答案pdf

Java 程序员 后端

Redis 变慢了?那你这样试试,不行就捶我,mybatis工作原理图

Java 程序员 后端

Redis 笔记之 Java 操作 Redis(Jedis),springcloud实战pdf

Java 程序员 后端

Nginx + Tomcat 搭建负载均衡,大牛带你直击优秀开源框架灵魂

Java 程序员 后端

Nginx配置反向代理和负载均衡,疯狂java讲义pdf百度云

Java 程序员 后端

Amazon Redshift Spectrum 将数据仓库扩展到 EB 级别且无需加载(二)_语言 & 开发_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章