写点什么

Amazon 发布可持续性数据集,可用于多个领域的数据分析

  • 2019-02-12
  • 本文字数:1155 字

    阅读完需:约 4 分钟

Amazon发布可持续性数据集,可用于多个领域的数据分析

Amazon Web Services Open Data(AWSOD)和 Amazon Sustainability(AS)正在合作,为 AWS Simple Storage Service(S3)提供可持续性的数据集,并通过预处理数据集来实现最佳的数据检索,从而消除无差异的繁重工作。可持续性数据集通常来自卫星、地质研究、气象雷达、地图、农业研究、大气研究、政府和很多其他来源。


Amazon Web Services Open Data(AWSOD)和 Amazon Sustainability(AS)正在合作,为 AWS Simple Storage Service(S3)提供可持续性的数据集,并通过预处理数据集来实现最佳的数据检索,从而消除无差异的繁重工作。可持续性数据集通常来自卫星、地质研究、气象雷达、地图、农业研究、大气研究、政府和很多其他来源。


2018 年 12 月 10 日,AWSOD 和 AS 团队发布了第一组数据集。这些数据集向现有的 AWS Open Data 数据集种添加了一种新数据类别。这些可持续性数据集之前已经被公开,AWS 现在正在改进数据集的访问便利性,例如,将大型存档文件分成可以独立检索的较小的可寻址块。AWS 使用 Simple Storage Service(S3)存储数据,并将存储桶设置为公开可访问。Simple Notification Services(SNS)用于向消费者发起新数据通知,并且在少数情况下使用 CloudFront 通过应用程序编程接口提供数据,以便加快检索速度。


为了进一步促进新数据集的使用,AWS 正在与 Group on Earth Observations(GEO)合作,拨出 150 万美元的 AWS Cloud Credits,以获得有关地球的见解。


AWS 提供了如何使用可持续性开放数据集的文档以及用于搜索数据集的标签。“非洲土壤信息服务(AfSIS)土壤化学”数据集可以用来学习如何将机器学习应用于开放数据。使用开放数据集的社区第三方贡献者发布了一些博文,介绍了如何使用公共数据集:



此外,AWS 的一些客户成功地在云端使用可持续性数据:



负责农业数据分析的 Sebastian Fritsch 参与了 AWS 有关卫星数据集使用的问答,他被问道:“在你看来有什么亮点吗”?他回答说:“只需要修改几行代码就可以将数据产品从相对较小的试点区域扩展到全局,对我们来说,这是一个亮点”。


在可持续性数据集发布之前,AWS Global Open Data 主管 Jed Sundwall 谈到了如何不断改进 AWS 传输 PB 级开放数据的能力。AWS 正在向开放数据集中添加各种索引(包括外部索引、文件命名和内部索引),以增加访问便利性。AWS 的工作人员正在观察社区的情况,并意识到他们可以通过社区构建的数据集处理机制来衡量数据集的成功程度。最后,AWS 提供了一个明确定义的程序,用于支付成本,并让新的贡献者通过AWS提供公共数据集。


查看英文原文:https://www.infoq.com/news/2019/01/amazon-sustainability-datasets


2019-02-12 14:513501
用户头像

发布了 731 篇内容, 共 451.7 次阅读, 收获喜欢 2002 次。

关注

评论

发布
暂无评论
发现更多内容

Vue 学习笔记-2

多选参数

vue.js Vue vuejs

IO系列——用户空间与内核空间

Java联盟

io 零拷贝 用户空间 内核空间 zero copy

【区块链+通证经济】从量变到质变区块链发展的下一阶段是什么?

CECBC

数字货币 防篡改 通证

除了技术,加密货币开发者更应关注可使用性

CECBC

加密货币 用户为本 可使用性 容错机制

LeetCode题解:1. 两数之和,JavaScript,双循环暴力解法,详细注释

Lee Chen

大前端 LeetCode

如何识别刷屏文章中的伪科学

Lee Chen

大前端 随笔杂谈

Flink Weekly | 每周社区动态更新

Apache Flink

flink

腾讯面试题: 百度搜索为什么那么快?

小松漫步

面试

英特尔中国研究院宋继强:芯片、系统、软件成为异构计算的三层级

最新动态

Demo 示例:如何原生的在 K8s 上运行 Flink?

Apache Flink

flink

推荐 16 款 IDEA 插件,让你的开发速度飞起来!

Bruce Duan

idea插件

JVM系列之:对象的锁状态和同步

程序那些事

JVM GC 同步

关于中台,可能都是正确的废话

FinClip

中台 业务中台

2. 妈呀,Jackson原来是这样写JSON的

YourBatman

Java json Jackson Fastjson

敏捷软件开发宣言及十二原则

BigYoung

敏捷开发

CDN百科第七期 | 关于CDN的原理、术语和应用场景那些事

阿里云Edge Plus

CDN

性能优化

独孤魂

OAM 深入解读:如何基于 OAM Runtime 编写一个扩展 Trait?

钱王骞

云原生 k8s OAM

LeetCode001-两数之和-easy

书旅

算法 LeetCode 数据结构与算法

报志愿|想学区块链,要上什么大学?报什么专业?

CECBC

高考 报考志愿 区块链专业 高校学院

阿里巴巴大规模应用 Flink 的实战经验:常见问题诊断思路

Apache Flink

flink

架构师训练营第八周笔记

Melo

高能预警!Apache Flink Meetup · 上海站返场啦

Apache Flink

flink

主宰操作系统的经典算法

苹果看辽宁体育

后端 操作系统

四十个鹏城春夏,一场数字繁花

脑极体

Vue 学习笔记-3

多选参数

vue.js Vue vuejs

脑洞:基于Enterprise Continuum证明DDD用于构建汽车的可行性

冯文辉

企业架构 领域驱动设计 DDD 架构演进

第7周作业

文古

胡继晔:发挥我国优势把依法治网落实到区块链管理中

CECBC

CECBC 胡继晔 依法治网 数字货币监管

最高法主张加强数字货币产权保护有法可依

CECBC

数字货币 法偿货币 中国人民银行 虚拟财产

架构师训练营第八周学习总结

张明森

Amazon发布可持续性数据集,可用于多个领域的数据分析_数据库_Aslan Brooke_InfoQ精选文章