HarmonyOS开发者限时福利来啦!最高10w+现金激励等你拿~ 了解详情
写点什么

浅析 Microsoft DNA 存储

  • 2016-05-04
  • 本文字数:1089 字

    阅读完需:约 4 分钟

Microsoft 正在实验用人工合成 DNA 实现数字化数据存储,并于最近向遗传学初创公司 Twist Bioscience 购买了一千万条 DNA。

据悉 Microsoft 有关 DNA 存储的实验是与华盛顿大学(University of Washington)合作进行的。联合研究团队最近提交了一份描述下图所示完整 DNA 归档存储系统架构述的论文

DNA 存储系统由一个对数据进行编码,以便将数据存储在 DNA 中的 DNA 合成器;一个包含大量“隔间”,将 DNA 的存储池与数据卷进行映射的存储容器;以及负责读取 DNA 序列并将其重新转换为原始数据的 DNA 序列器组成。

DNA 存储技术目前有个非常有趣的问题需要解决:寻址。DNA 链是 DNA 存储的基本单位,DNA 链由大约 100-200 个核苷酸组成,可存储 50–100 比特信息。这意味着一个典型的数据对象需要映射至大量 DNA 链。研究人员目前使用了键 - 值架构,因此这里的关键在于首先需要关联至包含所需链的池,随后通过随机访问机制访问池中的链。

另一个有趣之处在于数据的呈现方式。DNA 由 4 个碱基(A、C、G、T)组成,因此 base-4 是最直接的数据呈现方法,例如 01110001 可通过 base-4 的方式转换为 1301,并映射为 DNA 序列中的 CTAC 结构。然而除此之外,研究人员还选择了一种 base–3 呈现方式,借此可通过一个核苷酸实现纠错。那么在上述的例子中,01100001 可转换为 base-3 格式的 01112,并映射至为 DNA 序列中的 CTCTG 结构。

有关 DNA 存储原理的详细信息,包括如何通过编码改善可靠性,以及目前进行过的几个实验,可参阅上文提及的 PDF 论文。

根据 Twist Bioscience 公司介绍,相对传统数字化存储,基于 DNA 的归档技术可提供两个重要优势:寿命更长,最新研究数据显示 DNA 数据存储的寿命高达 2000 年;并且数据密度更高,一克 DNA 即可存储一兆 GB 数据。

根据 Microsoft 和华盛顿大学研究人员的介绍,DNA 存储并不是闪存或硬盘的替代品:

我们将 DNA 存储视作一种最持久的深层存储体系,可提供高密度且持久的归档存储方案,以及数小时乃至数天的访问时间。

这种想法的重点在于,DNA 的合成和排序可以任意程度的序列化方式进行,因此可以轻松获得所需的读写带宽。

Microsoft 公司 DNA 存储项目主管 Doug Carmean 澄清说,他们使用 Twist 提供的 DNA 进行初步测试“证明了数字化数据可通过这种方式进行编码,并可 100% 还原为原始数据”,但在这种技术正式商用之前还有很多工作有待完成。

作者:Sergio De Simone
阅读英文原文 A Look at Microsoft DNA Storage


感谢张龙对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-05-04 19:001686
用户头像

发布了 283 篇内容, 共 106.6 次阅读, 收获喜欢 62 次。

关注

评论

发布
暂无评论
发现更多内容

网络虚拟世界不是法外之地,必须严打网络暴力

石头IT视角

Spring 简介

小万哥

Java spring 后端 spring-cloud spring-boot

C语言驱动开发之内核解锁与强删文件

梦笔生花

[国产化-银河麒麟v10桌面版]FTP适配(FtpClient)

alexgaoyh

Java web 麒麟操作系统 ftp服务 FtpClient commons.net

springboot+activiti+vue+mysql轻松搞定审批!(源码)

金陵老街

鲲鹏助力清华大学夺取SolverChallenge2023竞赛冠军

彭飞

山东布谷科技直播软件源码探索高效、稳定直播传输的技术介绍:流媒体传输技术

山东布谷科技

软件开发 直播 源码搭建 直播软件源码 流媒体技术

火山引擎DataTester:AB实验平台未来演进趋势是怎样的?

字节跳动数据平台

大数据 AB实验 对比试验 企业号 8 月 PK 榜 数字化增长

户外LED显示屏如何设计散热?

Dylan

设计 环境 LED显示屏 户外LED显示屏 led显示屏厂家

产品管理经验分享:删掉 500 个产品待办事项后,我逃离了「假敏捷」

LigaAI

产品经理 敏捷开发 需求管理 产品管理 企业号 8 月 PK 榜

亚马逊云科技助力涂鸦智能出海,家庭能源管理系统(HEMS)将成智能家居新沃土

Lily

go-zero 是如何实现计数器限流的?

AlwaysBeta

Go 微服务 限流算法 go-zero 限流器

SpringBoot3文件管理

Java 架构 springboot SpringBoot3

MySQL教学,是不是干货你说的算

java易二三

MySQL 数据库 程序员 计算机 电脑

面试官:说说Spring中@NotEmpty、@NotBlank、@NotNull 的区别和使用

java易二三

程序员 架构 计算机

cilium 原理之sock_connect

沃趣科技

数据库 云计算 ebpf cilium 沃趣科技

13. Python的文件操作

茶桁

Python 文件操作

火山引擎VeDI助力零售品牌私域运营 实现与会员高效“沟通”

字节跳动数据平台

大数据 云服务 数据平台 火山引擎 企业号 8 月 PK 榜

go-zero 是如何做路由管理的?

AlwaysBeta

Go 源码 微服务 go-zero 路由

Programming abstractions in C阅读笔记:p88-p90

codists

Vulkan-性能及精细化

江湖修行

android OpenGL ES opengl 渲染 vulkan

从零开始,快速掌握VPS服务器的使用技巧与窍门!

一只扑棱蛾子

VPS VPS服务器

向量检索在大模型应用场景的技术和实践

百度Geek说

人工智能 百度 企业号 8 月 PK 榜

大咖云集︱2023第二届中国PMO&PM大会倒计时15天!

新消费日报

在2023年及以后可以改善企业业务的五种软件

高端章鱼哥

项目管理 软件开发 业务管理

用户空间协议栈设计和netmap综合指南

华为云开发者联盟

后端 开发 华为云 华为云开发者联盟 企业号 8 月 PK 榜

条条大路通罗马系列—— 使用 Hiredis-cluster 连接 Amazon ElastiCache for Redis 集群

亚马逊云科技 (Amazon Web Services)

Amazon

微软为AI投了多少钱?以及是否要担心这笔疯狂的资本支出

B Impact

vivo 场景下的 H5无障碍适配实践

vivo互联网技术

前端 H5 移动端适配 无障碍适配 体验提升

汽车及汽车零部件行业云MES解决方案

万界星空科技

解决方案 MES系统 汽车

浅析Microsoft DNA存储_语言 & 开发_Sergio De Simone_InfoQ精选文章