写点什么

20 个大数据必知领域之「HDFS」

  • 2020-05-29
  • 本文字数:462 字

    阅读完需:约 2 分钟

20个大数据必知领域之「HDFS」


Hadoop 分布式文件系统(HDFS)是指被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统(Distributed File System)。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS 是一个高度容错性的系统,适合部署在廉价的机器上。HDFS 能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS 放宽了一部分 POSIX 约束,来实现流式读取文件系统数据的目的。HDFS 在最开始是作为 Apache Nutch 搜索引擎项目的基础架构而开发的。HDFS 是 Apache Hadoop Core 项目的一部分。


HDFS 有着高容错性(fault-tolerant)的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS 放宽了(relax)POSIX 的要求(requirements)这样可以实现流的形式访问(streaming access)文件系统中的数据。

一线实践案例


2020-05-29 11:00951

评论

发布
暂无评论
发现更多内容

时序引擎架构和实例演练

KaiwuDB

龙蜥开发者说:众人拾柴火焰高!聊一聊我在社区的所思所想 | 第 14期

OpenAnolis小助手

开发者 开源社区 龙蜥开发者说 LoongArch 架构 红旗软件

使用 ClusterResourceSet 为 Cluster API 集群自动安装 CNI 插件

Se7en

案例分享:硬件敏捷

ShineScrum

Scrum 敏捷开发 TDD 硬件敏捷

【Java技术专题】「原理专题」深入分析Java中finalize方法的作用和底层原理

洛神灬殇

Java JVM Finalizer 12月月更

Triple 协议支持 Java 异常回传的设计与实现

Apache Dubbo

Java 开源 微服务 gRPC dubbo

多模态交互在数智化营销服中的技术实践

中关村科金

人工智能 算法 全栈 数字化转型 多模态

2023年内蒙古等保测评公司有哪些?五家还是6家?

行云管家

等保 等保测评 内蒙古

MVP、原型、概念验证,傻傻分不清楚?

敏捷开发

开发 MVP 原型

uniapp 在微信小程序中图片宽度显示问题

ModStart

活动预约报名系统怎么做?快来借鉴「苍山徒步之家」的经验做法

天天预约

微信小程序 SaaS 数据统计 预约工具 活动报名

Gitea 的邮件通知

HoneyMoose

软件测试简历书写 | 简历中应该如何描述才能体现出软技能的实力 ?

测试人

软件测试 自动化测试 简历 软技能 测试开发

如何通过Java应用程序将Word转为Excel

在下毛毛雨

Java Excel word 文档 转换

Tapdata Cloud 场景通关系列: Oracle → MySQL 异构实时同步

tapdata

oracle 异构数据 MySQL 数据库 实时数据 数据同步工具

浅谈权限系统在多利熊业务应用

百度Geek说

百度 权限系统 12 月 PK 榜 多利熊

容器安全的三大挑战

SEAL安全

容器安全 12 月 PK 榜

90%的Java开发人员都会犯的5个错误

JAVA旭阳

Java

Git之使用GitHub搭建远程仓库

芯动大师

GitHub、 git 学习 代码托管 分支管理 clone代码

参与Getaverse早期建设,成为节点验证者!!

Geek_Web3

#区块链# did #Web3

信息安全等级测评师证书有效期是多久?谁能告诉一下?

行云管家

等保

架构实战营 模块三作业 外包学生管理系统架构设计

西山薄凉

「架构实战营」

软件测试面试 | 一面试就紧张,怎么办?

霍格沃兹测试开发学社

非正式全面解析 NebulaGraph 中 Session 管理

NebulaGraph

图数据库 会话管理 session管理

PHP 中类自动加载相关文件分析

ModStart

智能低代码平台,驱动企业数字化转型

元年技术洞察

低代码 数字化转型

【MySQL】数据库索引 - 浅谈索引类型

非晓为骁

Go 数据库 索引 MySQL 数据库

2022-12-28:有n个黑白棋子,它们的一面是黑色,一面是白色, 它们被排成一行,位置0~n-1上。一开始所有的棋子都是黑色向上, 一共有q次操作,每次操作将位置标号在区间[L,R]内的所有棋子翻

福大大架构师每日一题

golang 算法 福大大

Java高手速成│Java程序怎样和数据库对话

TiAmo

JDBC 数据库· 12月月更

说透IO多路复用模型

京东科技开发者

开发 系统 epoll poll Lunix

软件测试|HTTPS 的通信

霍格沃兹测试开发学社

20个大数据必知领域之「HDFS」_大数据_闫佳忆_InfoQ精选文章