AICon全球人工智能与机器学习技术大会周四开幕,点击查看完整日程>> 了解详情
写点什么

如何为 Amazon S3 中的 AWS KMS 加密数据启用跨账户 Amazon Redshift COPY 和 Redshift Spectrum 查询(三)

  • 2019 年 12 月 27 日
  • 本文字数:1468 字

    阅读完需:约 5 分钟

如何为 Amazon S3 中的 AWS KMS 加密数据启用跨账户 Amazon Redshift COPY 和 Redshift Spectrum 查询(三)

执行 Amazon Redshift COPY

  1. 从您的查询工具登录 Amazon Redshift 集群并使用下面的 DDL 创建客户表。


SQL


CREATE TABLE customer (  c_custkey      INTEGER NOT NULL,  c_name         VARCHAR(25) NOT NULL,  c_address      VARCHAR(25) NOT NULL,  c_city         VARCHAR(10) NOT NULL,  c_nation       VARCHAR(15) NOT NULL,  c_region       VARCHAR(12) NOT NULL,  c_phone        VARCHAR(15) NOT NULL,  c_mktsegment   VARCHAR(10) NOT NULL);
复制代码


2.现在,您可以成功运行下面的 COPY 语句。


SQL


copy customer from 's3://rs-xacct-kms-bucket/customer/' iam_role '<IAM role ARN of redshift_role_account_b,IAM role ARN of xacct_kms_role_account_b>'gzipregion 'us-west-2';
复制代码


注意:替换账户 B 中的 IAM 角色 ARN,用逗号隔开,周围不加任何空格。


3.运行下面的示例查询,以确认数据已成功加载。


SQL


select * from customer limit 10;
复制代码


为要查询的 Redshift Spectrum 设置 AWS Glue 数据目录表

现在,我们在账户 B 中创建 AWS Glue 爬网程序,以对相同的


客户数据进行爬网,并按照下面的步骤在 AWS Glue 数据目录数据库


spectrumdb_account_b 中创建称为


客户的表:


  1. 在 AWS Glue 控制台中导航至数据库并选择添加数据库以创建称为

  2. spectrumdb_account_b 的 AWS Glue 数据目录数据库,如下所示。



  1. 在 AWS Glue 控制台中导航至爬网程序并选择添加爬网程序,如下所示。



  1. 如下所示创建爬网程序

  2. customerxacct。



注意:爬网程序作业名称(在此案例中为


customerxacct)与爬网程序创建的表名称不同(经常容易混淆)。表名称从前缀中自动选择,文件夹名称从 S3 存储桶和文件夹结构中自动选择。如果需要,您还可以选择附加表名称前缀。 __


  1. 选择下一步进入

  2. 客户表的数据存储详细信息,如下所示。



  1. 选择下一步进入添加另一个数据存储,我们保留默认设置,因为我们没有要添加的任何其他数据存储。



  1. 选择下一步,为要使用的爬网程序选择早前创建的 IAM 角色

  2. glue_service_role_account_b,如下所示。



  1. 选择下一步进入计划页面,然后选择您希望此爬网程序作业运行的计划。在此示例中,我们可以选择按需运行



  1. 选择下一步,以将 AWS Glue 数据目录数据库 spectrumdb_account_b(早前通过创建外部架构命令创建)选为爬网程序输出位置。



  1. 选择下一步以进入查看页面。



  1. 查看详细信息后,选择完成以完成爬网程序的创建。



  1. 现在,我们通过如下所示选择作业并选择运行爬网程序来运行爬网程序作业。



  1. 等待作业完成。作业状态从正在开始改变为停止,再改变为就绪。您可以选择刷新按钮来了解最新状态。



  1. 如果作业失败,失败情况将记录在 Amazon CloudWatch Logs 中。要查看日志,请选择前面的屏幕截图中所示的日志,然后您将进入 CloudWatch Logs。

  2. 现在,我们进入 AWS Glue 数据目录数据库,以确保表格存在。


选择数据库,选择


spectrumdb_account_b 数据库,然后选择查看表,或选择数据库名称的超链接。您应该会看到如下所示的客户表。



  1. 选择客户超链接以进入外部表,详细信息如下。



由于数据文件没有标题记录,AWS Glue 爬网程序已分配一个默认的列命名约定,如前所示。对于客户表,该命名从列 0 到列 7


  1. 选择编辑架构并按照下面的映射分配适当的列名称。


c0 => c_custkey


c1 => c_name


c2 => c_address


c3 => c_city


c4 => c_nation


c5 => c_region


c6 => c_phone


c7 => c_mktsegment


完成时,选择保存



本文转载自 AWS 技术博客。


原文链接:https://amazonaws-china.com/cn/blogs/china/how-to-enable-cross-account-amazon-redshift-copy-and-redshift-spectrum-query-for-aws-kms-encrypted-data-in-amazon-s3/


2019 年 12 月 27 日 11:30164

欲了解 AWS 的更多信息,请访问【AWS 技术专区】

评论

发布
暂无评论
发现更多内容

阿里云低延时直播 RTS 能力升级 让直播推流效果更佳

阿里云视频云

阿里云 音视频 直播技术 视频云

商业智能BI,会成为下一个风口吗?

数智化转型俱乐部

阿里云 数据中台 数据分析 BI 商业智能

WorkPlus综合企业数字化解决方案—华侨城

WorkPlus Lite

企业 移动开 开源软件

我可以减肥失败,但我的 Docker 镜像一定要瘦身成功!

尔达Erda

Docker 开源 云原生 镜像 瘦身

BTAU比特金盾系统软件开发内容

喜讯:恒拓高科荣获“2020年度华侨城集团优秀数字化服务商”称号

WorkPlus Lite

开源 解决方案 即时通讯 开源软件

WorkPlus高端制造业数字化解决方案—中集集团

WorkPlus Lite

企业 即时通讯 协同办公 开源软件

网络攻防学习笔记 Day76

穿过生命散发芬芳

网络攻防 7月日更

科创人|决策易赵祝维:从满足应用需求到服务业务目标,从SaaS服务商到业务合作伙伴

科创人

国内首发!阿里高工手码分布式系统速成笔记!

Java 编程 程序员

Gemini Mining双子矿业系统APP开发模板

TcaplusDB君 | 行业新闻汇编(7月12日)

tcaplus

TcaplusDB

云原生数据库的幕后英雄—浅谈分布式数据库的计算和存储分离

Geek_459987

PHA挖矿|PHA云算力挖矿系统开发案例

Geek_23f0c3

区块链 云算力挖矿系统开发详解 PHA矿机挖矿

Pravega Flink connector 的过去、现在和未来

Apache Flink

flink

从Encoder-Decoder模型入手,探索语境偏移解决之道

华为云开发者社区

神经网络 ASR 语境偏移 CLAS ASR模型

深度解析HashMap底层实现架构

华为云开发者社区

Java hashmap 底层 底层架构 Map接口

面试官:order by 是怎样排序的?怎么优化?

JavaFish

Java MySQL 数据库 后端 order by

如何实现70%丢包下音视频的高可用-信令篇

ZEGO即构

音视频 弱网 QUIC协议

Polar Network/PN币挖矿APP系统开发搭建

优评海洋APP系统开发模板

差点跳起来了!阿里首推22w字Java面试复盘宝典成功助我入职美团

白亦杨

Java 编程 程序员

《计算机网络 PDF》搞起!

cxuan

前端 后端 计算机网络

Ubuntu Server 20.04搭建Redis集群

玏佾

redis redis集群 搭建 redis cluster

HarmonyOS Connect伙伴峰会重庆站举办 生态建设持续完善

科技汇

名列GitHub必看榜!腾讯架构师纯手敲Spring Boot高级进阶笔记

Java架构追梦

Java 架构 腾讯 面试 springboot

华为首次发布HarmonyOS职业认证,助力开发者实现职业进阶

科技汇

膜拜!阿里内部都在强力进阶学习springboot实战派文档

Java spring 程序员 架构 面试

TcaplusDB君 · 行业新闻汇编(7月15日)

TcaplusDB

Data TcaplusDB NoSQL数据库 tencendb

北鲲云超算与传统的超算中心有什么不同?

北鲲云

速拼商城APP系统开发介绍

数据cool谈(第2期)寻找下一代企业级数据库

数据cool谈(第2期)寻找下一代企业级数据库

如何为 Amazon S3 中的 AWS KMS 加密数据启用跨账户 Amazon Redshift COPY 和 Redshift Spectrum 查询(三)-InfoQ