立即领取|华润集团、宁德核电、东风岚图等 20+ 标杆企业数字化人才培养实践案例 了解详情
写点什么

十大最热门的大数据技术

  • 2016-03-18
  • 本文字数:707 字

    阅读完需:约 2 分钟

随着大数据分析市场的快速渗透到各行业务,哪些大数据技术是刚需?哪些技术有极大的潜在价值?

根据弗雷斯特研究公司发布的指数,这里给出最热的十个大数据技术:

  1. 预测分析:随着现在硬件和软件解决方案的成熟,许多公司利用大数据技术来收集海量数据、训练模型、优化模型,并发布预测模型来提高业务水平或者避免风险;
  2. NoSQL 数据库:非关系型数据库包括 Key-value 型(Redis)数据库、文档型(MonogoDB)数据库、图型(Neo4j)数据库;
  3. 搜索和知识发现:支持信息的自动抽取,可以从多数据源洞察结构化数据和非结构化数据;
  4. 流式分析:软件可以对多个高吞吐量的数据源进行实时的清洗、聚合和分析;
  5. 内存数据结构:通过动态随机内存访问(DRAM)、Flash 和 SSD 等分布式存储系统提供海量数据的低延时访问和处理;
  6. 分布式存储系统:分布式存储是指存储节点大于一个、数据保存多副本以及高性能的计算网络;
  7. 数据可视化:数据可视化技术是指对各类型数据源(包括 Hadoop 上的海量数据以及实时和接近实时的分布式数据)进行显示;
  8. 数据整合:通过亚马逊弹性 MR(EMR)、Hive、Pig、Spark、MapReduce、Couchbase、Hadoop 和 MongoDB 等软件进行业务数据整合;
  9. 数据预处理:数据整合是指对数据源进行清洗、裁剪,并共享多样化数据来加快数据分析;
  10. 数据校验:对分布式存储系统和数据库上的海量、高频率数据集进行数据校验,去除非法数据,补全缺失。

感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群InfoQ 好读者(已满),InfoQ 读者交流群(#2)InfoQ 好读者)。

2016-03-18 19:0012546
用户头像

发布了 43 篇内容, 共 28.4 次阅读, 收获喜欢 7 次。

关注

评论

发布
暂无评论
发现更多内容

嵌入式系统软件开发:你需要知道的一切

龙智—DevSecOps解决方案

嵌入式系统 嵌入式系统软件开发

TDSQL | 数据异常的本质和价值详解

腾讯云数据库

数据库 tdsql

什么是色彩心理学?

坚果

心理学 11月日更

Alibaba 新产 SpringCloud Aliababa(全彩第四版)开源

Geek_1df311

Java 编程 架构 微服务

混沌工程:分布式系统稳定性的“疫苗”

中原银行

微服务 云原生 混沌工程

Flux 源码之reactor 核心原理及概述

漫游指南

reactor Flux

图文并茂!你管这破玩意儿叫TCP?

热爱java的分享家

Java TCP 程序人生 编程语言 经验分享

Go语言学习查缺补漏ing Day4

Regan Yue

Go 语言 11月日更

欢迎 Apache ShardingSphere 社区海外新晋 Committer!

SphereEx

开源社区 ShardingSphere SphereEx Committer

这一次,飞书改变「飞书」

ToB行业头条

金融级数据库新坐标:腾讯云TDSQL发布全自研新敏态引擎

腾讯云数据库

数据库 tdsql

TDSQL | HTAP系统的问题与主义之争

腾讯云数据库

数据库 tdsql

恒源云(GPUSHARE)_教你如何团队合作搞算力!

恒源云

人工智能 深度学习 云算力

大咖说·未来组织的底层逻辑

大咖说

云计算

如何使用SAP CRM Marketing Survey创建一个市场问卷调查

汪子熙

SAP abap 11月日更 Survey

第四范式x英特尔“AI应用与异构内存编程挑战赛”圆满收官

第四范式开发者社区

Java 处理表格,真的很爽!

程序员鱼皮

Java

如果你正在准备面试TCP,看这一篇就够了

热爱java的分享家

Java 架构 程序人生 编程语言 经验分享

秀出新天际的SpringBoot笔记,让开发像搭积木一样简单

热爱java的分享家

Java 架构 程序人生 编程语言 经验分享

前端避坑指南丨辛辛苦苦开发的APP竟然被判定为简单网页打包?

YonBuilder低代码开发平台

云小课 | SA基线检查---给云服务的一次全面“体检”

华为云开发者联盟

态势感知 华为云 基线检查 上云合规 全面体检

保持清洁的Git提交记录,三招就够了

Geek_1df311

Java 开源 架构 git 学习

Docker心经

卫先生

Python 编译器 编译器远程连接docker docker常用命令 docker总结

业务流程建模,你真的做对了吗

明道云

打造数字化软件工厂 —— 一站式 DevOps 平台全景解读

CODING DevOps

DevOps 研发管理 CODING

TDengine助力顺丰科技大数据监控改造

TDengine

tdengine 时序数据库

分析师机构发布中国低代码平台现状分析报告,华为云AppCube为数字化转型加码

华为云开发者联盟

低代码 数字化 华为云 低代码平台 AppCube

TDSQL | 云时代,我们到底需要怎样的数据库?

腾讯云数据库

数据库 tdsql

供应链安全隐患迫在眉睫,2021年全球APT攻击暗藏何种趋势?

科技热闻

WeTest.net全球能力开放:锻造高品质产品,构建全球竞争力

WeTest

使用ABAP代码返回S/4HANA Material上维护的Attachment明细

汪子熙

SAP S/4HANA 11月日更 Material

十大最热门的大数据技术_大数据_侠天_InfoQ精选文章