QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

Precog:大数据分析即服务

  • 2012-10-11
  • 本文字数:1153 字

    阅读完需:约 4 分钟

近日, Precog 宣布了他们的大数据仓储和分析服务,该服务负责处理数据的抓取、变换分析和可视化等过程,以及服务运行所基于的基础架构。不过,这一服务也通过 RESTful API 预留了各种开放的访问点,支持开发者和数据科学家控制整个过程。

Precog 可以从各种数据源抓取输入数据,其中包括 SQL 数据库、Amazon S3、Hadoop、MongoDB、客户端 Web 应用和后端服务器等。 RESTful API 支持开发者从外部源(如 Twitter 或 Facebook)、CSV 文件或移动设备抓取数据。抓取的数据保存到一个叫做 PrecogDB 的定制数据库中,而且我们还可以使用人群统计、态度、位置和其他信息使数据更为丰富。

之后,数据可以通过多种手段加以分析,比如通过一个 API ,或是利用客户库(JavaScript,PHP),或者使用 Labcoat (一种支持使用 Quirrel 这种声明式查询语言进行数据分析的 IDE)。开发者可以创建自己的数据抓取、强化和分析模块,甚至可以将这些模块拿到市场上销售。

Precog 能够将整个过程运行在不同的云供应商之上——如 Amazon EC2 和 SoftLayer——以便增加系统的弹性和正常运行时间。

在 InfoQ 进行的一次采访中,Precog 的 CEO 和创始人 John A. De Goes 解释到:

“(系统的)架构与数据库分析有些相似,比如都包括面向列的存储;但是其区别在于,前者支持完全异构的、非规范化的数据,通过对 Quirrel 的支持,相对于使用 RDBMS 进行分析,使用这种类似于“面向大数据的 R”的语言,你能够很方便地执行很多更为高级的计算。”

PrecogDB 是该平台的核心,它是一种用 Scala 编写的、面向列的数据库,运行在 JVM 上,它也为数据捕获和分析进行了优化。据 De Goes 介绍,PrecogDB 中可以保存“测量数据,如点击、购买、尺寸、Twitter 数据,或是收集自其他各种活动的日志信息”。他还补充道,“Precog 尚不能存储大块的非结构化数据,尽管在生物信息学和其他一些领域的应用的确有这种需求。不过这一功能已经在我们的路线图上了。”

至于 Quirrel——这种由 Precog 实现的统计查询语言,De Goes 谈到:“Quirrel 很多方面都与 R 编程语言比较相似。像 R 一样,Quirrel 也是为高级的分析与统计而设计的。但与 R 不同的是,Quirrel 并非图灵完备的语言,它是纯声明式的,利用它更容易高效地在大规模集群的机器中分发 Quirrel 查询(这也使 Quirrel 比 R 更容易学习)。”

PrecogDB 有一些“用于常见的分析与统计计算的内置例程”,它还提供了一个“细粒度的、基于能力的安全模型,支持来自移动设备或 Web 的应用程序通过 RESTAPI 直接访问其功能”。

查看英文原文 Precog: Big Data Analytics as a Service


感谢侯伯薇对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2012-10-11 01:514212
用户头像
臧秀涛 略懂技术的运营同学。

发布了 300 篇内容, 共 136.8 次阅读, 收获喜欢 35 次。

关注

评论

发布
暂无评论
发现更多内容

OPPO关停自研芯片公司哲库,这对行业将产生什么影响?

福大大架构师每日一题

芯片 福大大

超级独角兽 Databricks 的崛起之路

CnosDB

时序数据库 开源社区 CnosDB Databricks

Charles(HTTP代理服务器)注册安装教程

Rose

Charles注册码 Charles下载 HTTP代理服务器

背靠香港影视集团星光文化,StarNFT问世了

股市老人

单调队列算法模板及应用

timerring

算法

软件测试/测试开发丨Pytest测试用例生命周期管理-Fixture

测试人

软件测试 自动化测试 测试开发 测试用例 pytest

Git 远程仓库失效

Andy

C++中的可移植性和跨平台开发

小万哥

XMind思维导图安装教程XMind 2023最新版下载

Rose

XMind教程 XMind思维导图 XMind2023下载 XMind2023新功能 XMind如何使用

软件测试/测试开发丨学习笔记之Allure2测试报告

测试人

Python 软件测试 自动化测试 测试开发 Allure

Kafka008——浅谈Broker的存储架构

Codyida

后端

如何使用Go语言实现软件设计中的‘对扩展开放、修改关闭’原则

Jack

CleanMyMac X专业的Mac清理工具,一次激活,永久使用

Rose

CleanMyMac下载 CleanMyMac v4.13.4 Mac清理优化工具 苹果电脑系统清理软件

SecureCRT v9.3.2最新版 激活安装教程

Rose

SSH工具 SecureCRT下载 SecureCRT激活版 SecureCRT许可证

基于容器和Kubernetes的应用无限扩容

俞凡

Kubernetes 最佳实践 云原生

背靠香港影视集团星光文化,StarNFT问世了

鳄鱼视界

MySQL中使用group_concat()函数进行分组排序

源字节1号

开源 软件开发 小程序开发

IDA Pro 7 for Mac(静态反编译工具)快捷键

理理

IDA Pro 7 破解 IDA Pro 7 Mac下载 静态反编译软件 IDA Pro快捷键

使用 MacBook Pro 时如何防止过热

理理

MacBook 电脑「降温」

测试写代码的好处

FunTester

idea每次打开新的类依次排列

源字节1号

开源 软件开发 小程序开发

代开病假单|代办病假条|体检报告|诊断证明书

病假条病假单

JavaScript作用域深度剖析:从局部到全局一网打尽

Immerse

Prompt learning 教学[技巧篇]:通过增加示例、引导词、特殊符号指令等方式让chatgpt输出更好的答案

汀丶人工智能

人工智能 自然语言处理 ChatGPT prompt learning

如何在OpenJ9场景下使用Arthas

骑牛上青山

Java JVM Arthas openj9

Git客户端SmartGit许可证下载 支持M1 SmartGit汉化教程

理理

mac软件下载 Git客户端 SmartGit下载 SmartGit破解版 SmartGit许可证

苹果电风扇软件Macs Fan Control Pro中文版注册码

理理

Macs Fan Control Pro Mac电脑风扇控制 风扇转速和温度

C语言编程-环境设置

芯动大师

C语言 环境搭建 三周年连更

PS 2023中文一键安装版 Photoshop永久使用

Rose

Photoshop 2023中文版 photoshop下载 PS2023下载 PS 2023破解

抠图软件Topaz ReMask 5 如何设置成中文?

理理

Topaz ReMask 5中文 Topaz ReMask 5破解 好用的抠图软件 Topaz ReMask 5汉化教程

Precog:大数据分析即服务_DevOps & 平台工程_Abel Avram_InfoQ精选文章