10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

基于 S3 的图片处理服务

  • 2019-11-11
  • 本文字数:3559 字

    阅读完需:约 12 分钟

基于S3的图片处理服务

作者:高寅敬 徐榆

1.背景介绍

随着移动互联网的快速发展,各种移动终端设备爆发式的增长,社交类 APP 或者电商网站为了提升访问速度、提高用户体验,必须根据客户端的不同性能,不同屏幕尺寸和分辨率提供适当尺寸的图片。这样一来开发者通常需要预先提供非常多种不同分辨率的图片组合,而这往往导致管理难度的提升和成本的增加。


在这篇博客中,我们将探讨一种基于 S3 的图片处理服务,客户端根据基于 HTTP URL API 请求实时生成不同分辨率的图片。

2.解决方案架构


为了保证图片服务的高可用,我们会把所有的图片(包括原图和缩率图)储存于 AWS 的对象储存服务 S3 中,把图片处理程序部署于 AWS EC2 中。大部分的图片请求都会直接由 AWS S3 返回,只有当 S3 中不存在所需缩率图时才会去请求部署于 EC2 上的图片处理服务来生成对应分辨率图片。


业务流程:


  1. 用户客户端(通常是浏览器或者 APP)发起请求 200×200 像素的图片

  2. S3 中未存在该尺寸缩率图,于是返回 HTTP 302 Redirect 到客户端

  3. 客户端根据 HTTP 302 响应,继续请求部署于 EC2 上的图片处理服务

  4. 部署于 EC2 的图片处理服务,会从 S3 获取源图

  5. 图片处理服务,根据请求参数生成对应尺寸图片缩率图

  6. 图片处理服务将对应的图片返回给客户端

  7. 图片处理服务把缩率图存回到 S3 中,加速下一次客户访问

3.架构特点

相较于预先生成所有所需分辨率图片和传统的基于独立图片处理服务器,这种新的处理方式包含以下优点:

更高的灵活性:

当我们的前端开发人员对界面进行改版时,时常会涉及到修改图片尺寸。对所有原始图片进行缩放的批处理是十分耗时,高成本且易出错的。利用这种基于 URL API 的实时处理方式,前端开发者指定新的尺寸后,立即就能生成符合客户访问新的网页和应用对应的图片,提高了前端开发人员的开发效率。

更低的储存成本:

对于传统图片处理方式,在未使用之前预先批量生成所需分辨率图片,占用大量的储存空间,而且利用率并不高。


以按需方式生成图片,能减少不必要的储存空间,降低储存成本。


相对于独立图片处理服务器把图片完全储存于 EC2 的 EBS 卷,储存于 S3 的成本也更低。


我们知道缩率图是属于可再生数据,所以我们在程序上 会把缩率图储存为 S3 的去冗余储存类型,再次降低约 13% 的存储成本。

更高的服务可用性:

我们可以看到,独立地部署单台图片服务器,无法支持大并发负载。同时存在单点故障 无法保证服务的高可用性,高可扩展性。


而基于 S3 的解决方案,大量的图片请求,由 AWS S3 来完成,S3 会自动扩展性能,因此应用程序的运行速度在数据增加时不会减慢。


只有少量的未生成的图片尺寸才会用到部署于 EC2 的图片服务器,并且我们图片逻辑服务器与图片储存 S3 是解耦合关系,我们还可以针对 基于 EC2 的图片处理服务 进行横向扩展,比如把图片服务程序 加入到 Web 服务器层,配合 负载均衡器 ELB、自动伸缩组 AutoScaling 来实现自动伸缩。

4.服务部署

为了服务部署能更接近生产环境,我们以下所有步骤将以创建一个以域名为 images.awser.me 的图片服务为例,来详细介绍如何基于 AWS 来部署。


在 EC2 上部署图片处理服务


1.创建一台 EC2 服务器,并赋予 具有 S3 访问权限的IAM 角色,配置正确的安全组开启 HTTP 80 端口访问权限。



  1. 示例程序基于 PHP,所以需要确保服务器安装了 Apache 2.4 和 PHP 7.0 以上。以及 PHP 图片处理的相关的组件:ImageMagick、ImageMagick-devel 。


参考 基于 Amazon Linux 的安装命令:


yum -y install httpd24 php70 ImageMagick ImageMagick-devel php70-pecl-imagick php70-pecl-imagick-devel


  1. github 或者 从S3 下载图片处理程序,修改 根目录 resize.php 文件,bucketName 变量为你的域名或者是你的储存桶名称,例如:$bucketName=’images.awser.me’。


将程序部署于你的 web 目录底下,并且确保 能通过 EC2 公网 IP 进行访问。


例如:http://52.80.80.80/resize.php?src=test_200x200.jpg


最好为你的图片服务器设置一个域名,我们这里设置了 imgpro.awser.me。


例如: http://imgpro.awser.me/resize.php?src=test_200x200.jpg


这里记录下你的 EC2 Web 访问地址,在下一步的 S3 储存桶配置中会用到。


创建和配置 S3 储存桶


  1. 创建储存桶


由于我们在生产环境中,需要使用指定的域名来访问 S3 资源。所以我们需要在 S3 控制台 创建储存桶时,把储存桶名称设置为我们的域名,如: images.awser.me。


  1. 储存桶权限控制


在刚刚创建的 S3 储存桶,权限选项卡中 选择储存桶策略填写如下内容(注意修改 images.awser.me 为你的域名 或者 储存桶名称) 开启匿名访问


Java


{
"Version":"2012-10-17",
"Statement":[
{
"Sid":"AddPerm",
"Effect":"Allow",
"Principal": "*",
"Action":["s3:GetObject"],
"Resource":["arn:aws-cn:s3:::images.awser.me/*"]
}
]
}
复制代码


  1. 开启静态网站托管


在刚刚创建的 S3 储存桶,属性选项卡中 开启 静态网站托管 ,并配置 重定向规则 为以下示例内容(请修改 HostName 为上一步骤 所创建的 EC2 Web 访问地址):


Java


<RoutingRules>
<RoutingRule>
<Condition>
<KeyPrefixEquals/>
<HttpErrorCodeReturnedEquals>404</HttpErrorCodeReturnedEquals>
</Condition>
<Redirect>
<Protocol>http</Protocol>
<HostName>imgpro.awser.me</HostName>
<ReplaceKeyPrefixWith>resize.php?src=</ReplaceKeyPrefixWith>
<HttpRedirectCode>302</HttpRedirectCode>
</Redirect>
</RoutingRule>
</RoutingRules>
复制代码



记录终端节点名称 例如:images.awser.me.s3-website.cn-north-1.amazonaws.com.cn


在 DNS 服务商 添加一个 CNAME 记录 ,把你的自定义域名 如 images.awser.me 解析到 该终端节点上。


  1. 配置 S3 存储桶生命周期,自动清理缩率图


随时时间推移,我们会发现我们保存着在大量过时的缩率图,造成储存空间的浪费。其实我们可以利用 S3 存储桶的生命周期功能,来实现一定时间范围以外的缩率图自动清理。


在 S3 储存桶管理选项卡中,选择 添加生命周期规则



由于我们在图片缩放程序中,产生缩率图的过程,已经给所有缩率图打上了一个特殊标签 thumbnail = yes,那么我们就可以在生命周期规则中,把该标签作为过滤条件,这样才不会影响储存桶中的其他资源(如原图)。



然后在过期选项中设置,过期时间为 30 天。



这样配置完以后,所有缩率图生成三十天后会自动清理,来节省储存和管理成本。

5.测试图片缩放

首先上传一张测试图片至 S3 存储桶,我们选择一张经典的地球图片作为测试 命名为 earth.jpg。


1.测试使用 S3 终端节点访问,测试储存桶 权限是否配置正确:


http://images.awser.me.s3-website.cn-north-1.amazonaws.com.cn/earth.jpg


2.测试使用 自定义域名访问,测试储存桶命名以及 DNS 配置是否正确


http://images.awser.me/earth.jpg


3.测试图片缩放功能是否正常,尝试请求一张 200×200 像素的图片:


http://images.awser.me/earth_200x200.jpg


如果一切正常,我们可以看到浏览器 会自动跳转访问


http://imgpro.awser.me/resize.php?src=earth_200x200.jpg


并返回 200×200 像素的图片。


4.测试 S3 缓存是否生效,当我们第二次访问


http://images.awser.me/earth_200x200.jpg 如果一切正常,我们可以观察到 浏览器 没有做跳转。

6.总结

以上内容是对基于 S3 的图片处理服务解决方案的一个简单实现,也提到一部分生产环境可能遇到的问题,比如图片服务器的自定义域名、使用 S3 低冗余储存类型来降低成本、缩率图的自动清理等。


其实实际生产环境还可以对成本进行进一步优化,比如可以分析 S3 产生的访问日志,找出访问记录比较久远的对象 、调用 S3 API 对长久未使用的缩率图进行定时清理,甚至可以根据日志做分析 找出热门的图片格式需求,提前针对热门图片生产缩率图,提高用户体验。


另外通过以上的架构描述可以看出,由于 AWS 所提供的所有云服务都有丰富的 API 接口 和详细的配置选项,它就像一个乐高玩具一般,开发人员或者架构师可以脑洞大开随意去组合它成为自己想要的产品。


作者介绍:



高寅敬,AWS 解决方案架构师,负责基于 AWS 云计算方案架构的咨询和设计,在国内推广 AWS 云平台技术和各种解决方案。在加入 AWS 之前就职于美国虚拟运营商 Seawolf 海狼通讯,超过 7 年的互联网通信应用系统开发和架构经验。


超过 5 年的 AWS 实践经验, 精通基于 AWS 全球分布式 VoIP 系统的开发、运营及部署,深度理解 AWS 核心的计算、网络、存储以及云计算的弹性伸缩。



徐榆,AWS 实习架构师,研究生一年级对云计算/大数据和人工智能有一定研究。


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/image-processing-service-based-on-s3/


2019-11-11 08:001765

评论

发布
暂无评论
发现更多内容

解读 AppStore 新功能:自定义产品页面和 A/B Test 工具

37手游iOS技术运营团队

ios apple AB testing实战 appstore 马甲包

权威认可!腾讯云数据安全中台入选2021先锋实践案例

腾讯安全云鼎实验室

#腾讯云 数据安全中台

基于 WebRTC 的1 对 1 通话实战(二)信令服务器实现

IT酷盖

音视频 WebRTC 信令服务器

星火矿池APP源码开发

获客I3O6O643Z97

区块链+

图解URL、URI和URN 区别

devpoint

API url 7月日更

对标Shopify的千亿市值,有赞还要走多久?

ToB行业头条

SaaS 电商SaaS

【LeetCode】最高频元素的频数Java题解

Albert

算法 LeetCode 7月日更

DAPP系统源码模式开发定制

获客I3O6O643Z97

DAPP智能合约交易系统开发 DAPP系统开发

物联网通信技术,那些你不知道的事

华为云开发者联盟

物联网 网络 通信 有线 无线

【大牛系列教学】2021年Android程序员职业规划

欢喜学安卓

android 程序员 面试 移动开发

微信朋友圈高性能分析

十二万伏特皮卡丘

架构训练营

策略+IOC 消灭ifelse,拿来吧你

skow

Java 设计模式 代码设计

如何优雅地关闭SpringBoot应用程序?听我给你讲

麦洛

Spring Boot

mysqldump备份技巧分享

Simon

MySQL 逻辑备份

产研效率提升-工具篇-消息中心

循环智能

效率 方法 工具 流程 消息

史上最全关于苹果开发者账号及上架APPStore总结

孙叫兽

苹果 APP开发 appstore app上架

服务限流限流算法、限流策略以及该在哪里限流

Jokay

高可用 分布式限流 限流算法 限流 单机限流

和12岁小同志搞创客开发:遥控舵机

不脱发的程序猿

DIY 创客开发 控制舵机

【大牛疯狂教学】熬夜整理2021最新Android高级笔试题

欢喜学安卓

android 程序员 面试 移动开发

详解Spring中Bean的作用域与生命周期

华为云开发者联盟

spring 容器 ioc bean Bean对象

Go语言,并发控制神器之Context

微客鸟窝

Go 语言

白林学院校友会小程序前端和后台管理系统设计方案

CC同学

校友录小程序 校友会小程序 同学录小程序

一招教你数据仓库如何高效批量导入与更新数据

华为云开发者联盟

数据库 数据仓库 GaussDB(DWS) MERGE INTO

Triton推理服务器在阿里云机器学习PAI-EAS公测啦!!!

阿里云大数据AI技术

PHA挖矿系统源码开发介绍

获客I3O6O643Z97

PHA矿机挖矿 PHA质押挖矿

超好玩:使用 Erda 构建部署应用是什么体验?

尔达Erda

开源 DevOps 云原生 PaaS Go 语言

穿越六年艰难转型,明道云终于再获主流投资

明道云

互联网

带你了解两种线性规划的方法:稀疏矩阵存储和预处理

华为云开发者联盟

矩阵 存储 线性规划 稀疏矩阵 预处理

从源码分析Hystrix工作机制

vivo互联网技术

Java 源码分析 分布式 Hystrix

频繁创建基于Etcd实现的分布式锁会有什么问题?

BUG侦探

分布式锁 etcd 内存泄漏

Flutter Android 工程结构及应用层编译源码深入分析

工匠若水

flutter android dart Gradle 工匠若水

基于S3的图片处理服务_其他_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章