【AICon】 如何构建高效的 RAG 系统?RAG 技术在实际应用中遇到的挑战及应对策略?>>> 了解详情
写点什么

MongoDB 推出 Atlas Data Lake 预览版本,可直接访问 Amazon S3

  • 2019-06-20
  • 本文字数:985 字

    阅读完需:约 3 分钟

MongoDB推出Atlas Data Lake预览版本,可直接访问Amazon S3

近日,MongoDB在 MongoDB World 上宣布了 MongoDB Atlas 家族的新成员——MongoDB Atlas Data Lake,目前已发布公开测试版本。MongoDB Atlas Data Lake 的出现将使得 MongoDB 可以应用于云大数据湖。随着企业在Amazon S3等云存储中积累的数据越来越多,他们对于如何有效处理这些数据的需求也越来越旺盛。


MongoDB Atlas Data Lake 可以使用 MongoDB 查询语言,该语言专为丰富、复杂的结构而构建,可以处理以 JSON、BSON、CSV、TSV、Avro 和 Parquet 格式存储的数据。数据按需分析,无需基础设施设置,无需耗时的转换、预处理或元数据管理。因为没有预先定义的架构,所以可以更快地处理数据。


作为 MongoDB Atlas 云数据平台中提供的按需服务,没有部署过程,只需要提供对 S3 存储桶的访问。用户可以使用与 MongoDB Atlas 操作集群相同的 UI 配置 Atlas Data Lake,通过一个简单的向导来配置权限,提供对 S3 存储桶的只读访问权限,将 S3 目录映射到数据库和集合,并使其做好运行查询的准备。


通过 MongoDB 查询语言,用户可以将一个技能集应用于数据湖和事务数据库。它不仅仅是与 Data Lake 一起使用的查询语言,而且也兼容 MongoDB 驱动程序、MongoDB Shell、MongoDB Compass 和 MongoDB BI Connector。这意味着使用 JavaScript、Perl、Python、C、C ++、Java、Ruby、Go、Scala、R 和许多其他语言编写的应用程序也可以使用 MongoDB 用户之前部署的驱动程序访问 Data Lake。数据科学家可以使用 R 驱动程序支持下的 R Studio 工具 或者 Python 驱动程序支持下的 Jupyter 笔记本来进行统计、机器学习和数据湖分析。


目前,MongoDB Atlas Data Lake 部署了多个计算节点来分析每个 S3 存储桶,并针对该存储桶的数据进行处理查询。这些节点并行工作,在桶区域中进行快速处理,能够最大限度地减少数据传输和相关成本。完成后,每个节点将其结果返回到中心节点,该节点根据需要对单独的结果进行排序、过滤和聚合为最终结果。


对于 Data Lake 用户,此过程完全透明,允许他们继续从工作中提取该数据的价值和洞察力。这意味着对应用于数据的并发查询没有限制,计算节点架构的未来增强也会对用户透明。



MongoDB Atlas Data Lake 旨在通过用户已有的数据湖中获得最佳效果,包含分析数据、构建数据服务、提供机器学习和 AI 以及构建活动档案。


原文链接


https://www.mongodb.com/blog/post/mongodb-atlas-data-lake-debuts-at-mongodb-world


2019-06-20 15:139292
用户头像

发布了 497 篇内容, 共 305.9 次阅读, 收获喜欢 1906 次。

关注

评论

发布
暂无评论
发现更多内容

HTTP/1.1协议中的八种请求

百度搜索:蓝易云

云计算 Linux 运维 HTTP 云服务器

CSS图像边框:Interop 2023的一个重点领域

南城FE

CSS 前端 图像边框

朴素的DevOps价值观

华为云PaaS服务小智

软件开发 华为云

Tidy Up for Mac(重复文件查找清理工具)v6.0.4激活版

iMac小白

AI虚拟数字人在线生成系统源码展示!

青否数字人

数字人

大厂经验谈之OKR目标管理

巫山老妖

docker安装minio

百度搜索:蓝易云

Docker Linux 运维 Minio 云服务器

极狐GitLab 16.9 重磅发布,赶快来 pick 你喜爱的功能吧~

极狐GitLab

数仓实践丨从CU入手优化HStore表

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 华为云GaussDB(DWS)

Go workspace的使用

fliter

Programming Abstractions in C阅读笔记:p303-p305

codists

ubuntu安装指定版本:nodejs

百度搜索:蓝易云

Linux ubuntu 运维 Node 云服务器

SmartZipper for Mac(专业压缩解压工具)v2.10激活版

iMac小白

Lights Out for Mac(扩展节能器)v3.2修复激活版

iMac小白

Disk Graph for Mac(磁盘空间分析工具)v3.0.2激活版

iMac小白

牛刀专业低代码平台开发实战—三会议案

牛刀专业低代码

低代码 起步牛刀低代码 牛刀低代码 牛刀专业低代码 牛刀低代码paas平台

Git 教程:解密 .gitignore 文件、合并分支、解决冲突、及 Git 帮助

小万哥

git 程序人生 编程语言 软件工程 后端开发

Gateway API与Ingress:Kubernetes网络的未来

Gingxing

kong api 网关 Kong 网关 消息网关 Kong Gateway

Native SQLite Manager for Mac(极简SQLite数据库管理器)v1.27.3激活版

iMac小白

GM CHM Reader Pro for mac(CHM阅读器)v2.5.3激活版

iMac小白

从smallredbook.item_get_video看电商行业的发展趋势

技术冰糖葫芦

API 文档

抖音详情API:API请求格式与参数详解

技术冰糖葫芦

API 接口

GraphicConverter 12 for Mac(图片浏览器)v12.1.1(6434)中文激活版

iMac小白

Things3 for Mac(日程和任务管理工具)v3.20中文免激活版

iMac小白

Screen Recorder by Omi Mac(Omi录屏专家‬)v1.3.8激活版

iMac小白

一文搞懂设计模式—享元模式

码农BookSea

Java 设计模式

Tower for Mac(强大的Git客户端)v10.4注册激活版

iMac小白

深入解析Python并发编程的多线程和异步编程

华为云开发者联盟

Python 多线程 开发 华为云 华为云开发者联盟

构建企业多维模型,助力财务战略规划

智达方通

战略规划 全面预算 多维模型 财务规划

OpenAI和谷歌,AI对线中的飞驰人生

脑极体

AI

李林甫,天才制度大师还是庸才裱糊匠?

酱紫的小白兔

MongoDB推出Atlas Data Lake预览版本,可直接访问Amazon S3_服务革新_Dj Walker-Morgan_InfoQ精选文章