写点什么

Precog:大数据分析即服务

  • 2012-10-11
  • 本文字数:1153 字

    阅读完需:约 4 分钟

近日, Precog 宣布了他们的大数据仓储和分析服务,该服务负责处理数据的抓取、变换分析和可视化等过程,以及服务运行所基于的基础架构。不过,这一服务也通过 RESTful API 预留了各种开放的访问点,支持开发者和数据科学家控制整个过程。

Precog 可以从各种数据源抓取输入数据,其中包括 SQL 数据库、Amazon S3、Hadoop、MongoDB、客户端 Web 应用和后端服务器等。 RESTful API 支持开发者从外部源(如 Twitter 或 Facebook)、CSV 文件或移动设备抓取数据。抓取的数据保存到一个叫做 PrecogDB 的定制数据库中,而且我们还可以使用人群统计、态度、位置和其他信息使数据更为丰富。

之后,数据可以通过多种手段加以分析,比如通过一个 API ,或是利用客户库(JavaScript,PHP),或者使用 Labcoat (一种支持使用 Quirrel 这种声明式查询语言进行数据分析的 IDE)。开发者可以创建自己的数据抓取、强化和分析模块,甚至可以将这些模块拿到市场上销售。

Precog 能够将整个过程运行在不同的云供应商之上——如 Amazon EC2 和 SoftLayer——以便增加系统的弹性和正常运行时间。

在 InfoQ 进行的一次采访中,Precog 的 CEO 和创始人 John A. De Goes 解释到:

“(系统的)架构与数据库分析有些相似,比如都包括面向列的存储;但是其区别在于,前者支持完全异构的、非规范化的数据,通过对 Quirrel 的支持,相对于使用 RDBMS 进行分析,使用这种类似于“面向大数据的 R”的语言,你能够很方便地执行很多更为高级的计算。”

PrecogDB 是该平台的核心,它是一种用 Scala 编写的、面向列的数据库,运行在 JVM 上,它也为数据捕获和分析进行了优化。据 De Goes 介绍,PrecogDB 中可以保存“测量数据,如点击、购买、尺寸、Twitter 数据,或是收集自其他各种活动的日志信息”。他还补充道,“Precog 尚不能存储大块的非结构化数据,尽管在生物信息学和其他一些领域的应用的确有这种需求。不过这一功能已经在我们的路线图上了。”

至于 Quirrel——这种由 Precog 实现的统计查询语言,De Goes 谈到:“Quirrel 很多方面都与 R 编程语言比较相似。像 R 一样,Quirrel 也是为高级的分析与统计而设计的。但与 R 不同的是,Quirrel 并非图灵完备的语言,它是纯声明式的,利用它更容易高效地在大规模集群的机器中分发 Quirrel 查询(这也使 Quirrel 比 R 更容易学习)。”

PrecogDB 有一些“用于常见的分析与统计计算的内置例程”,它还提供了一个“细粒度的、基于能力的安全模型,支持来自移动设备或 Web 的应用程序通过 RESTAPI 直接访问其功能”。

查看英文原文 Precog: Big Data Analytics as a Service


感谢侯伯薇对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2012-10-11 01:514629
用户头像
臧秀涛 略懂技术的运营同学。

发布了 300 篇内容, 共 150.0 次阅读, 收获喜欢 35 次。

关注

评论

发布
暂无评论
发现更多内容

恢复青春气息,就靠这套人像美肤算法了

博文视点Broadview

算法 计算机视觉 图像识别 人像

操作系统bochs安装及使用

allworldg

操作系统

程序范式的意义

soolaugust

架构 程序设计

SpringCloud服务注册中心双节点集群(Eureka集群)

xcbeyond

Java 架构 微服务 Eureka 集群

Java-技术专题-synchronized关键字

码界西柚

易观郭炜:流动水系数造未来

易观大数据

影响音视频延迟的关键因素(一):流媒体系统

ZEGO即构

TCP udp RTC HLS RTMP

一个数据库管理员的自我救赎之路

华为云开发者联盟

数据库 华为云 数据库迁移 企业上云 DRS

关于日期及时间字段的查询

Simon

MySQL sql查询

是时候学习Linux了

Simon

Linux

我的敏捷历程 —— 兼评《敏捷整洁之道 - 回归本源》

FollowFlow

敏捷开发 Agile 极限编程 XP

面试官:你说你懂i++跟++i的区别,那你知道下面这段代码的运行结果吗?

程序员DMZ

JVM i++

实践案例丨教你一键构建部署发布前端和Node.js服务

华为云开发者联盟

node.js 后端 服务器 代码 华为云鲲鹏

海量并发也没那么可怕,运维准点下班全靠它!

华为云开发者联盟

容器 网络 并发 华为云

面试必杀技,讲一讲Spring中的循环依赖

程序员DMZ

spring

自从有了语音开黑小能手,队友再也不会骂我了!

anyRTC开发者

WebRTC 在线教育 直播 RTC RTMP

写作只是消遣?

Geek_db1689

写作 讨论写作 自我感悟 瞎想乱写

云上安全工作乱如麻,等保2.0来一下

华为云开发者联盟

安全 华为云 等保 云平台 多云服务

CRM往事丨三件事,所有SaaS的缩影

人称T客

MySQL索引问题探究手记

架构精进之路

MySQL 索引

钓鱼网站:详解hosts文件

xcbeyond

Java 域名解析 hosts

ARTS week 4

锈蠢刀

spring Cloud Eureka Rest接口重写

xcbeyond

Java SpringCloud Eureka

如果你每次面试前都要去背一篇Spring中Bean的生命周期,请看完这篇文章

程序员DMZ

spring 生命周期

MySQL5.7升级到8.0过程详解

Simon

MySQL

跨域问题(CORS / Access-Control-Allow-Origin)

xcbeyond

Java CORS 跨域

区块链、人工智能……警惕非法金融借创新概念迷惑投资人

CECBC

区块链 金融

MySQL关于日期为零值的处理

Simon

MySQL

枚举算法练习例题(Python版)

罗罗诺亚

Python 算法 枚举

SWARM学习1——Kademlia分布式路由表协议

AIbot

区块链 DHT 分布式存储 分布式文件存储 分布式路由

低/零代码干掉了传统的开发模式

代码制造者

编程语言 低代码 零代码 信息化 编程开发

Precog:大数据分析即服务_DevOps & 平台工程_Abel Avram_InfoQ精选文章