写点什么

嵌入式图像预览技术:允许人们在延迟加载过程中加载预览图像

  • 2019-09-12
  • 本文字数:5902 字

    阅读完需:约 19 分钟

嵌入式图像预览技术:允许人们在延迟加载过程中加载预览图像

本文介绍的嵌入式图像预览(Embedded Image Preview, EIP)技术允许我们在延迟加载过程中加载预览图像,该技术使用了渐进式 jpeg、Ajax 和 HTTP 范围请求,且不需要传输其他额外数据。 ​


低质量图像预览(LQIP)基于SVG的变体SQIP是当前延迟加载图像的两种主导性技术。这两种技术的共同之处在于,都会在加载过程中首先生成一个低质量的预览图像。这个预览图像会显示得比较模糊,在图像加载完成后,原图像会替换掉预览图像。试想一下,如果你想要在不加载额外数据的情况下向网站访问者显示预览图像,那该怎么做呢?


JPEG 文件通常采用延迟加载技术,根据技术规范,图像其中包含的数据有可能以这样一种方式进行存储:可以让图像先显示其粗略的内容,之后再显示详细的图像内容。于是在这样的加载过程中,图像不再是从上到下逐渐加载显示出来,这也被称作基线模式,而是可以首先非常快速地显示一幅模糊的图像,之后图像会逐渐变得越来越清晰,即渐进模式。



基线模式



渐进模式


除了更快地显示整图全貌从而带来更好的用户体验之外,渐进式 jpeg 的文件通常也比基线编码 jpeg 的文件更小。根据 Yahoo 开发团队的 Stoyan Stefanov 的说法,对于 10 Kb 以上的文件,在使用渐进模式编码时,有94%的可能性会生成更小的图像文件


如果你的网站中包含许多 jpeg 文件,你就会注意到,即使是采用渐进模式,在加载网页时可能也会一个接一个地进行 jpeg 文件加载。这是因为现代浏览器同时只允许 6 个连接通往同一个域。因此,单凭渐进式 jpeg 并不能带给用户最快的页面体验。在最差的情况下,浏览器将在加载一个图像彻底完毕之后才去加载下一个图像。


本文想要提出的想法是,如果当前只从服务器加载某一指定字节数量的渐进式 JPEG,这样就可以快速显示出图像内容的梗概。稍后,在一个定义的时刻之后(例如,当当前视图中的所有预览图像都已加载完成),再去加载图像的剩余部分,而且不需要再次请求已在预览请求下加载完毕的部分。



使用两次请求加载一张渐进式 JPEG 图像


遗憾的是,你无法指示属性中的 img 标签在什么时刻应该加载多少图像。但是,对于 Ajax 格式的图像,这是可能做到的,前提是传送图像的服务器支持HTTP范围请求


如果使用了 HTTP 范围请求,客户端可以在 HTTP 请求头中通知服务器,会指明文件的哪些字节将包含在 HTTP 响应中。一般各类大型服务器(Apache、IIS、nginx 等)都支持这个特性,主要用于视频回放。假如用户一下跳转到视频的末尾,在用户最终看到所需的部分之前就加载完整的视频,这并不是很有效的做法。因此,只会向服务器请求用户所指定时刻前后的视频数据,这样用户才能尽可能快地从指定时刻继续观看视频。


所以,我们要解决这个问题,现在面临以下三个挑战:


  1. 创建渐进式 JPEG。

  2. 在第一个 HTTP 范围请求中指定加载预览图像必须的字节偏移量。

  3. 创建前端 JavaScript 代码。

1. 创建渐进式 JPEG

渐进式 JPEG 一般由几个被称为扫描段的部分组成,每个扫描段包含最终图像的一部分内容。而第一次扫描只会非常粗略地显示图像,在文件中随后进行的扫描会向已经加载的数据继续添加越来越详细的信息,并最终形成了图像最后的全貌。


每一次扫描所显示的外观由生成 jpeg 的具体程序决定。在 mozjpeg 项目中诸如 cjpeg 这样的命令行程序中,你甚至可以定义这些扫描具体包含哪些数据。但是,这当然需要更深的专业知识,而本文的范围并不包含这些。如果想了解更多相关知识,可以参考我的文章“JPG 终极理解”,该篇文章描述了 JPEG 压缩相关的基础知识。在 mozjpeg 项目的 wizard.txt 中详细地解释了扫描脚本中必须传递给程序的各个参数。在我看来,在快速渐进结构和文件大小之间,mozjpeg 使用的扫描脚本(会进行 7 次扫描)默认参数往往已经能达到很好的平衡,因此,推荐采用该默认参数。


要将一个初始 JPEG 文件转换为渐进 JPEG 文件,我们可以使用来自 mozjpeg 项目的 jpegtran 命令。这是一个可以对现有 JPEG 进行无损更改的工具。该工具Windows和Linux的预编译版本可以在网上找到。如果出于安全方面的考虑,你更愿意谨慎行事,那么最好自己构建这样的工具。


如上所述,我们使用 mozjpeg 中的命令行,现在创建我们的渐进 JPEG:


$ jpegtran input.jpg > progressive.jpg
复制代码


我们的目的是构建一个渐进式 JPEG,而这个过程完全是由 jpegtran 这条命令所负责的,并不需要我们进行任何显式的说明。而且,在这个过程中,原图像数据并不会以任何形式发生更改。改变的仅仅是文件中图像数据的排列顺序。


理想情况下,与图像外观无关的元数据(如 Exif、IPTC 或 XMP 数据)会从 JPEG 文件中抽取出来,因为其对应的数据段只能由元数据解码器在图像内容之前进行读取。由于这个原因,我们不能将它们移到文件中的图像数据后面,因此它们将与预览图像一起传送,并相应地对第一个请求进行扩展。使用命令行程序 exiftool,你可以轻松抽取出这些元数据:


$ exiftool -all= progress .jpg
复制代码


如果不希望使用命令行工具,还可以使用在线压缩服务 compress-or-die.com 生成不带元数据的渐进式 JPEG 文件。

2. 在第一个 HTTP 范围请求中指定加载预览图像必须的字节偏移量

现在 JPEG 文件已经被分成不同的扫描段,每个段包含不同的组件(包括图像数据,如 IPTC、Exif 和 XMP 的元数据,嵌入的颜色配置文件,量化表等等)。每个扫描段都以一个十六进制 FF 字节的标记作为开始。然后紧跟一个字节来指示段的类型。例如,D8 是 SOI 标记,即图像的开始,于是,每个 JPEG 文件都以 FF D8 这两个字节作为开头。


而每次扫描的开始都有 SOS 标记,即扫描的开始,用十六进制 FF DA 作为开头。由于 SOS 标记后面的数据采用熵编码(例如,jpeg 使用的是 Huffman 编码),所以为了实现解码功能,在 SOS 段之前还需要一个带有 Huffman 表的段(DHT),并用 FF C4 作为 DHT 段的开头。因此,在渐进式 JPEG 文件中,我们感兴趣的区域总是由 Huffman 表和扫描数据段交替构成。于是,如果想要显示出图像第一张非常粗略的扫描图,我们必须从服务器请求第二个 DHT 段(由十六进制 FF C4 作为开头)前面出现的所有字节。



JPEG 文件的结构


在 PHP 程序中,我们可以使用以下代码将所有扫描所需的字节数读入数组:


<?php$img = "progressive.jpg";$jpgdata = file_get_contents($img);$positions = [];$offset = 0;while ($pos = strpos($jpgdata, "\xFF\xC4", $offset)) {    $positions[] = $pos+2;    $offset = $pos+2;}
复制代码


我们必须将找到的位置加上 2,因为浏览器只有在遇到下一个新标记时才会渲染预览图像的最后一行,而如前所述,该起始标记由两个字节组成。


由于我们对本例中的第一个预览图像感兴趣,所以positions[3]。

3.创建前端 JavaScript 代码

首先,定义一个 img 标签,并且使之包含第 2 步中刚算出的字节位置:


<img data-src="progressive.jpg" data-bytes="<?= $positions[1] ?>">
复制代码


与许多延迟加载库的通常情况一样,这里没有直接定义 src 属性,因此浏览器在解析 HTML 代码时不会立即从服务器请求图像。


使用以下 JavaScript 代码加载预览图像:


var $img = document.querySelector("img[data-src]");var URL = window.URL || window.webkitURL;
var xhr = new XMLHttpRequest();xhr.onload = function(){ if (this.status === 206){ $img.src_part = this.response; $img.src = URL.createObjectURL(this.response); }}
xhr.open('GET', $img.getAttribute('data-src'));xhr.setRequestHeader("Range", "bytes=0-" + $img.getAttribute('data-bytes'));xhr.responseType = 'blob';xhr.send();
复制代码


这段代码创建了一个 Ajax 请求,这个请求通过 HTTP 范围请求头告诉服务器将文件从开始返回到 data-bytes 中指定的位置为止,不需要更多数据。如果该服务器能理解 HTTP 范围请求,它将以 HTTP-206 响应返回文件部分内容,并以 BLOB 格式返回二进制的图像数据,从中我们可以使用 createObjectURL 生成一个浏览器内部 URL。我们可以使用这个 URL 作为 img 标签的 src。这样,我们就完成了预览图像的加载。


同时,我们还将 BLOB 存储在 DOM 对象中的 src_part 属性中,因为之后将立即需要使用这些数据。


在开发人员控制台的网络选项卡中,你可以检查到,网页并未加载完整的图像,只是加载了图像的一小部分。此外,加载中的 blob URL 会以 0 字节的大小显示在控制台中。



加载预览图像时的网络控制台


因为我们已经加载了原始 JPEG 文件的头部,所以预览图像的大小是正确的。因此,根据应用程序,我们有时可以省略 img 标签的高度和宽度。

替代方案:内嵌加载预览图像

出于性能原因,也可以在 HTML 源代码中直接将预览图像的数据作为数据 URI 传输。这节省了传输 HTTP 头信息的开销,但是 base64 编码会使图像数据大小增长三分之一。如果你使用 gzip 或 brotli 之类的工具进行内容编码并传递给 HTML 代码,那么这相对而言可另当别论,但你仍然应该只为较小的预览图像使用数据 URI。


更重要的是,这样预览图像是即时可用的,用户在打开网页时不会体验到明显的延迟。


要做到这点,首先,我们必须为预览图像创建数据 URI,然后在 img 标签中使用这个 URI 作为 src。为此,我们通过 PHP 创建数据 URI,该代码基于以上刚刚创建的代码,即已经确定 SOS 标记的字节偏移量:


<?php
$fp = fopen($img, 'r');$data_uri = 'data:image/jpeg;base64,'. base64_encode(fread($fp, $positions[1]));fclose($fp);
复制代码


创建的数据 URI 现在作为 src 直接插入到“img”标签中:


<img src="<?= $data_uri ?>" data-src="progressive.jpg" alt="">
复制代码


当然,JavaScript 代码也需要进行修改:


<script>var $img = document.querySelector("img[data-src]");
var binary = atob($img.src.slice(23));var n = binary.length;var view = new Uint8Array(n);while(n--) { view[n] = binary.charCodeAt(n); }
$img.src_part = new Blob([view], { type: 'image/jpeg' });$img.setAttribute('data-bytes', $img.src_part.size - 1);</script>
复制代码


在本例中,不是通过 Ajax 请求来请求数据(在 Ajax 请求中,我们将立即收到一个 BLOB),而是必须从数据 URI 创建 BLOB。为此,我们从不包含图像数据的部分释放数据 URI,即 data:image/jpeg;base64。并且使用 atob 命令对剩余的 base64 编码数据进行解码。为了从现在的二进制字符串数据创建一个 BLOB,我们必须将数据传输到 Uint8 数组中,这可以确保数据不被视为 UTF-8 编码的文本。从这个数组中,我们现在可以用预览图像的图像数据创建一个二进制 BLOB。


因此,我们不必为这个内嵌版本调整之后的代码,而是将属性 data-bytes 添加到 img 标签上,而在前面的示例中,img 标签包含了一个字节偏移量,它指示了必须从哪里开始第二部分的图像加载。


在开发人员控制台的网络选项卡中,还可以检查得知,当 HTML 页面的文件大小增加时,加载预览图像也不会生成额外的请求。



将预览图像加载为数据 URI 时的网络控制台

加载最终图像

在第 2 步中,我们在两秒后加载图像文件的其余部分作为示例:


setTimeout(function(){    var xhr = new XMLHttpRequest();    xhr.onload = function(){        if (this.status === 206){            var blob = new Blob([$img.src_part, this.response], { type: 'image/jpeg'} );            $img.src = URL.createObjectURL(blob);        }    }    xhr.open('GET', $img.getAttribute('data-src'));    xhr.setRequestHeader("Range", "bytes="+ (parseInt($img.getAttribute('data-bytes'), 10)+1) +'-');    xhr.responseType = 'blob';    xhr.send();}, 2000);
复制代码


在这次的 HTML 范围请求头中,我们指定要从预览图像的结束位置请求图像到文件的结束位置。而第一个请求的响应存储在 DOM 对象的属性 src_part 中。我们使用这两个请求的响应用 new blob()创建一个新的 BLOB,其中包含整个图像的数据。由此生成的 BLOB URL 会再次用作 DOM 对象的 src 属性。现在,实现了图像的完全加载。


现在我们还可以在开发人员控制台的网络选项卡中再次检查每次加载的大小。



加载整个图像时的网络控制台(31.7 kB)

原型

在下面的 URL 中,我提供了一个可以使用不同参数进行试验的原型:http://embedimage-preview.cerdmann.com/prototype/


原型的 GitHub 存储库:https://github.com/mcsodbrenner/embedimage

最后的一些考虑

使用本文介绍的嵌入式图像预览(EIP)技术,我们可以在 Ajax 和 HTTP 范围请求的帮助下为渐进 jpeg 加载不同质量的预览图像。这些预览图像中的数据不会在之后被丢弃,而是完全被重用来显示整个图像。


此外,并不需要为之另外创建一个预览图像文件。在服务器端,只需要确定并保存预览图像结束时的字节偏移量。在 CMS 系统中,应该可以将这个数字保存为图像的属性,并在 img 标签输出时将其考虑在内。甚至可以将此抽象为一个工作流,它用偏移量来补充图片的文件名,例如 progressive-8343.jpg,这样就可以不在图片文件中保存这个偏移量。这个偏移量可以由 JavaScript 代码提取。


由于预览图像数据是可以重复使用的,因此,这种技术可以更好地替代目前的通常加载方法,即先加载一个预览图像文件,然后加载 WebP(并为不支持 web 的浏览器提供 JPEG 回退)。而预览图像常常会破坏 WebP 的存储优势,因为 WebP 不支持渐进模式。


目前,普通 LQIP 中的预览图像质量普遍较差,因为假设加载预览数据需要占用额外的带宽。正如 Robin Osborne 在2018年的一篇博客文章中所明确指出的那样,如果预览图像作为占位符并没有给出最终图像的概貌,那么它的存在实际上就没有多大意义。通过使用本文建议的技术,通过向用户提供渐进式 JPEG 的后续扫描,我们可以毫不犹豫地将更多的最终图像直接展示为预览图像。


如果用户的网络连接很不稳定,根据不同的应用程序的特性,不加载整个 JPEG 文件有时也有其意义,例如,不加载全图,而是省略最后两次扫描。这将生成一个小得多的 JPEG 文件,而其图像质量仅仅是略有下降。用户会为此感谢我们,而我们也不必再在服务器上存储额外的文件。


希望你在试用这个程序原型时能尽享其中的乐趣,我非常期待你的评论。


英文原文:


Faster Image Loading With Embedded Image Previews


2019-09-12 11:393529
用户头像

发布了 63 篇内容, 共 42.2 次阅读, 收获喜欢 119 次。

关注

评论

发布
暂无评论
发现更多内容

10+秒,AIGC炸出抖音小红书爆款!国产Fashion Diffusion颠覆时尚行业

Openlab_cosmoplat

AI 开源社区 时装

AntDB-S流式数据库体验

亚信AntDB数据库

AntDB AntDB数据库 企业号 5 月 PK 榜

大数据赋能商业地产研策

MobTech袤博科技

破解提升 LLMs 性能的黑匣子—— LlamaIndex

Zilliz

Milvus AIGC LLM llamaindex

大象转身只需点点鼠标,爆火 DragGAN 原理浅析

Zilliz

Towhee draggan

500行代码手写docker-以新命名空间运行程序

蓝胖子的编程梦

Docker 容器 命名空间 #k8s #云原生

WICC · 出海嘉年华|嘉宾就位、话题揭晓,峰会 & 派对报名倒计时

融云 RongCloud

融云 峰会 泛娱乐 出海 wicc

文件传输、文件同步、数据备份的有效解决方案

镭速

@开源爱好者,字节跳动这项技术,正式宣布开源了

字节跳动技术范儿

开源 字节跳动 数据仓库 Clickhouse

文心一言 VS 讯飞星火 VS chatgpt (22)-- 算法导论4.2 2题

福大大架构师每日一题

福大大 ChatGPT 文心一言 讯飞星火

Django笔记三十六之单元测试汇总介绍

Hunter熊

Python django 单元测试

什么是数字化?企业为什么要数字化转型

优秀

数字化转型 企业数字化转型 什么是数字化

YB时代,正寻找新的数据支点

脑极体

存储

iOS MachineLearning 系列(18)—— PoseNet,DeeplabV3与FCRN-DepthPrediction模型

珲少

重磅发布 |《2023年消费品企业数字化转型调研白皮书》

博睿数据

数字化转型 白皮书 博睿数据 消费品企业

Zebec生态进展迅速,频被BitFlow、Matryx DAO等蹭热度碰瓷

股市老人

聊聊「短信」渠道的设计与实现

Java 架构

线程是如何通讯的?

javacn.site

2023-05-25:给定一个正整数 x,我们将会写出一个形如 x (op1) x (op2) x (op3) x ... 的表达式 其中每个运算符 op1,op2,… 可以是加、减、乘、除之一 例如

福大大架构师每日一题

Go 算法 rust 福大大

520 | ChatGPT会是一个完美情人吗?

澳鹏Appen

人工智能 nlp 情感分析 数据标注 ChatGPT

用eBPF/XDP来替代LVS(三)

九零后程序员

云计算 Linux 云原生 LVS ebpf

Zebec生态官宣与BitFlow、Matryx DAO等无关,切勿碰瓷

BlockChain先知

Zebec生态进展迅速,频被BitFlow、Matryx DAO等蹭热度碰瓷

西柚子

华为云Toolkit活动:领取云计算8大领域50本干货电子书!

华为云PaaS服务小智

云计算 程序员 开发者 编程数据

AIGC背后的技术分析 | 机器学习?机器如何学习?

TiAmo

机器学习 AIGC julia

智慧水务系统如何进行有效的数据架构整改?三个企业的改造实践分享

爱倒腾的程序员

涛思数据 tdengine 时序数据库 taosdata

GitLab Dogfooding 实践:Web API 模糊测试

极狐GitLab

DevSecOps OpenAPI web api 模糊测试 dogfooding

得物前端巡检平台的建设和应用

得物技术

巡检

Solaris Network评述:在DeFi衍生品领域的颠覆者

股市老人

瑞云科技助力番职院打造虚拟数字人,探索职业教育创新之路

3DCAT实时渲染

虚拟现实 虚拟仿真 实时云渲染

嵌入式图像预览技术:允许人们在延迟加载过程中加载预览图像_语言 & 开发_Christoph Erdmann_InfoQ精选文章