写点什么

英国卫报联手 AWS:从 MongoDB 迁移到 PostgreSQL

  • 2019-01-11
  • 本文字数:1081 字

    阅读完需:约 4 分钟

英国卫报联手AWS:从MongoDB迁移到PostgreSQL

为了获得一个全托管的解决方案,英国卫报在 2018 年将 CMS 的数据存储从一个自托管的 MongoDB 集群迁移到了 Amazon RDS 上的 PostgreSQL。团队在没有停机的情况下进行了基于 API 的迁移。


英国卫报的内部 CMS(名为 Composer)存储着文章、博客内容、照片库和视频,它最初是以 MongoDB 为数据存储构建的。在此之前,用的是一个后台是 Oracle 数据库的供应商软件。在这种设置下,每当必须迁移模式时,都需要停机时间。作为替代方案,团队研究了各种 NoSQL 数据库,选择 MongoDB 的其中一个关键原因似乎是灵活性。MongoDB 最初托管在他们自己的数据中心里,在一次宕机后,他们将其转移到了 AWS 服务器上。安装和管理脚本必须由卫报的团队手写。他们选择了一项支持合同,并购买了 OpsManager 工具,这是一个管理 MongoDB 的前端应用程序。然而,不清楚因为什么原因,该团队没有选择 MongoDB Atlas 服务,这是一个“全托管的数据库”。OpsManager 不管理部署。


在迁移到 AWS 之后,团队遇到了两次 MongoDB 宕机。其中一些原因是基本的系统管理问题,比如不允许 NTP 访问时间服务器以保持时钟同步。根据这篇文章,还有一些和 OpsManager 本身管理困难以及很难从供应商那里获得及时的支持有关。其团队觉得,迁移到需要最少数据库管理工作的解决方案最适合他们。


该团队选择 PostgreSQL 的原因是,作为 Amazon RDS 上的托管数据库,它非常成熟,而且支持 jsonb 数据类型。Jsonb 类型允许对 JSON 对象中的字段进行索引。迁移计划是在 Postgres 上编写一个新的 API,并使用一个代理向这两个 API 发送流量,使它们对于新传入的数据保持同步。使用 API 迁移现有数据,然后将代理切换到新的 API。他们之前从 Oracle 迁移也是使用类似的方法完成的。为了跟踪迁移过程,迁移脚本日志被推送到 Elasticsearch。在此过程中,他们还改进了他们的结构化日志。


代理实时地将所有流量定向到 MongoDB API,并异步地定向到 Postgres API。响应中的任何差异都会被记录并分析。为了确保新的 API 和后端能够支撑生产流量,他们运行 GoReplay 进程来生成流量。GoReplay 可以捕获流量,并在不同的环境下进行回放——在本例中是预生产环境。他们在预生产环境上完成了完整的迁移过程。生产迁移的最后一步是将 DNS 名称从代理的端点(一个 Amazon ELB)切换到 Postgres API(另一个 ELB)。这使得它们的客户端可以在不做任何更改的情况下正常工作。迁移之后,他们的集成测试失败了,因为他们没有迁移到新的 API。


还有其他一些组织出于各种原因从 MongoDB 迁移到了 PostgreSQL。


查看英文原文:The Guardian’s Migration From MongoDB to PostgreSQL on Amazon RDS


2019-01-11 10:377270
用户头像

发布了 781 篇内容, 共 536.3 次阅读, 收获喜欢 1578 次。

关注

评论

发布
暂无评论
发现更多内容

GitLab 国际站中国大陆等地区停服,如何将数据快速迁移到云效

阿里巴巴云原生

阿里云 gitlab 云原生

场景题:如何实现亿级用户在线状态统计?

王磊

Vue 路由管理组件-Router

测试人

软件测试

恭喜 Apache RocketMQ、Apache Seata 荣获 2024 开源创新榜单“年度开源项目”

阿里巴巴云原生

Apache 阿里云 RocketMQ 云原生

GitLab 国际站中国大陆等地区停服,如何将数据快速迁移到云效

阿里云云效

阿里云 云原生

【YashanDB知识库】YCM Monit进程频繁误告警

YashanDB

数据库 yashandb

7分钟玩转 AI 应用,函数计算一键部署 AI 生图大模型

阿里巴巴云原生

阿里云 云原生 函数计算

群体基因组文献解读-Prediction of axillary lymph node metastasis in triple-negative breast cancer by multi-omics analysis and an integrate

INSVAST

基因检测 生信分析 Sentieon 三阴性乳腺癌 变异分析

云投集团:流程+数据,双轮驱动世界一流财务管理体系

用友智能财务

报表 财务 会计

推荐4款基于.NET开源、功能强大的CMS建站系统

不在线第一只蜗牛

开源

【YashanDB知识库】yasql执行报错

YashanDB

数据库 yashandb

我用RPA生成EXE,并使用激活码对EXE进行管理

火语言RPA

通义灵码 2.0 全新升级,阿里云正式推出繁星计划

阿里巴巴云原生

阿里云 云原生

流程+数据,双轮驱动世界一流财务管理体系访谈分享

用友智能财务

投资 访谈 会计

意图框架习惯推荐方案,为用户提供个性化内容分发

HarmonyOS SDK

harmoyos

探索Vue.js:提升前端开发的利器

测试人

软件测试

人形机器人的ChatGPT时刻即将到来,如何转入?

机器人头条

自动驾驶 大模型 人形机器人 科技、

2024年终总结:终于把北京房贷还清啦!

王中阳Go

面试题 找工作 年终总结 就业辅导 程序员创业

【YashanDB知识库】load data一次导入多个文件的数据时报错

YashanDB

数据库 yashandb

【YashanDB知识库】YAS-04115 "SELECT" expected but missing

YashanDB

数据库 yashandb

通义灵码 2.0 全新升级,阿里云正式推出繁星计划

阿里云云效

阿里云 云原生 通义灵码

2025年,全球人形机器人市场迎来新格局!!

机器人头条

自动驾驶 科技 大模型 人形机器人

去哪儿 Node 生成 1 亿张图片实践 (Satori + Sharp)

Qunar技术沙龙

人工智能 Ai绘图

京东广告生成式召回基于 NVIDIA TensorRT-LLM 的推理加速实践

京东科技开发者

淘宝天猫API接口深度探索:商品详情与关键词搜索商品列表的高效应用与实战代码

代码忍者

淘宝API接口

【YashanDB知识库】lYAS-02143 invalid username/password, login denied

YashanDB

数据库 yashandb

完全掌握|豆包MarsCode 编程助手使用技巧

Trae

人工智能 AI编程 豆包MarsCode

设计了两个弹性长度数字编码,可以灵活地编解码数字以便高效传输

Drunk

编码 路由协议 DCE

英国卫报联手AWS:从MongoDB迁移到PostgreSQL_数据库_Hrishikesh Barua_InfoQ精选文章