抖音技术能力大揭密!钜惠大礼、深度体验,尽在火山引擎增长沙龙,就等你来! 立即报名>> 了解详情
写点什么

20 个大数据必知领域之「Spark」

2020 年 5 月 29 日

20个大数据必知领域之「Spark」


Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark 是 UC Berkeley AMP lab (加州大学伯克利分校的 AMP 实验室)所开源的类 Hadoop MapReduce 的通用并行框架,Spark,拥有 Hadoop MapReduce 所具有的优点;但不同于 MapReduce 的是——Job 中间输出结果可以保存在内存中,从而不再需要读写 HDFS,因此 Spark 能更好地适用于数据挖掘与机器学习等需要迭代的 MapReduce 的算法。


一线实践案例


会议演讲推荐


2020 年 5 月 29 日 14:54520

评论

发布
暂无评论
发现更多内容

在vscode中go编码发生的问题整理

happlyfox

golang 学习 vscode 28天写作 3月日更

对htmlMeta的实例详解

佰草

html5

五个问题,三大策略,手把手教你定制App性能监控方案

友盟全域数据

监控 应用性能 监控工具 告警设置 质量监控

Timewait是什么

我是程序员小贱

3月日更

Redis核心技术与实战 学习笔记 02

escray

redis 极客时间 28天写作 3月日更 Redis 核心技术与实战

Kubernetes入门——深入浅出讲Docker

百度开发者中心

Docker Kubernetes 云原生

Kubernetes入门——Kubernetes工作原理及使用

百度开发者中心

#Kubernetes# #技术课程#

Java程序员面试15家公司收到15份offer,月薪35K全靠这Java面试小抄(2021版)开源分享

云流

Java 程序员 面试

人脸识别无间道

脑极体

PHP-Trait解析与使用

一个大红包

3月日更

案例+源码!阿里新产高并发技术小册太香了!内容涵盖高并发、网络编程、微服务、数据处理等诸多技术栈

程序员小毕

Java 程序员 面试 高并发 阿里

微服务的下一步,离不开服务网格

xcbeyond

微服务 Service Mesh 服务网格 3月日更

mysql5.7安装教程

xiezhr

MySQL 安装 MySQL 运维

吉他扒谱该怎么做?分享一款超好用的扒谱工具!

奈奈的杂社

腾讯极客技术挑战赛-writeup

思维转换 - 更好的认识世界

石云升

程序员成长 思维模型 28天写作 3月日更

校招开始,你做好【终身成长】的准备了吗?

闲鱼技术

第七.产品规划与功能规划

让我思考一会儿

ICASSP2021 M2VoC挑战赛报告会:高分队伍及评审分享回顾(附PPT)

爱奇艺技术产品团队

2021金三银四必备的1000道Java面试题以及答案整理【最新版】

云流

Java 编程 程序员 面试

Nginx 一个高性能的HTTP和反向代理服务器

赖猫

nginx 后端 后端开发 Linux服务器

uni-app跨端开发H5、小程序、IOS、Android(一):太强了,一次性搞定全端开发

黑马腾云

微信小程序 uni-app uniapp web前端 3月日更

Java的“泛型”特性,你以为自己会了?(万字长文)

比伯

Java 编程 程序员 架构 计算机

再迎巅峰!阿里内部Java编程思想全栈技术实录Github上线7天已经星标89K!

程序员小毕

Java 编程 程序员 架构 面试

小争哥的算法打卡1群-算法题打卡

黄敏

算法

React在函数组件中使用Ant-Design的Form(form组件和按钮属于不同的组件)

依旧廖凯

28天挑战 3月日更

(28DW-S8-Day26) 研发流程重整

mtfelix

28天写作

如何跨单元格绘制斜线

IT蜗壳-Tango

3月日更 IT蜗壳教学

Kyuubi: 网易数帆开源的企业级数据湖探索平台(架构篇)

网易数帆

大数据 spark 开源 Kyuubi

PC五年,华为如水

脑极体

论如何快速吃透算法?186道高阶算法题+学习资料程序员面试必备

比伯

Java 编程 架构 面试 程序人生

Study Go: From Zero to Hero

Study Go: From Zero to Hero

20个大数据必知领域之「Spark」-InfoQ