写点什么

Precog:大数据分析即服务

  • 2012-10-11
  • 本文字数:1153 字

    阅读完需:约 4 分钟

近日, Precog 宣布了他们的大数据仓储和分析服务,该服务负责处理数据的抓取、变换分析和可视化等过程,以及服务运行所基于的基础架构。不过,这一服务也通过 RESTful API 预留了各种开放的访问点,支持开发者和数据科学家控制整个过程。

Precog 可以从各种数据源抓取输入数据,其中包括 SQL 数据库、Amazon S3、Hadoop、MongoDB、客户端 Web 应用和后端服务器等。 RESTful API 支持开发者从外部源(如 Twitter 或 Facebook)、CSV 文件或移动设备抓取数据。抓取的数据保存到一个叫做 PrecogDB 的定制数据库中,而且我们还可以使用人群统计、态度、位置和其他信息使数据更为丰富。

之后,数据可以通过多种手段加以分析,比如通过一个 API ,或是利用客户库(JavaScript,PHP),或者使用 Labcoat (一种支持使用 Quirrel 这种声明式查询语言进行数据分析的 IDE)。开发者可以创建自己的数据抓取、强化和分析模块,甚至可以将这些模块拿到市场上销售。

Precog 能够将整个过程运行在不同的云供应商之上——如 Amazon EC2 和 SoftLayer——以便增加系统的弹性和正常运行时间。

在 InfoQ 进行的一次采访中,Precog 的 CEO 和创始人 John A. De Goes 解释到:

“(系统的)架构与数据库分析有些相似,比如都包括面向列的存储;但是其区别在于,前者支持完全异构的、非规范化的数据,通过对 Quirrel 的支持,相对于使用 RDBMS 进行分析,使用这种类似于“面向大数据的 R”的语言,你能够很方便地执行很多更为高级的计算。”

PrecogDB 是该平台的核心,它是一种用 Scala 编写的、面向列的数据库,运行在 JVM 上,它也为数据捕获和分析进行了优化。据 De Goes 介绍,PrecogDB 中可以保存“测量数据,如点击、购买、尺寸、Twitter 数据,或是收集自其他各种活动的日志信息”。他还补充道,“Precog 尚不能存储大块的非结构化数据,尽管在生物信息学和其他一些领域的应用的确有这种需求。不过这一功能已经在我们的路线图上了。”

至于 Quirrel——这种由 Precog 实现的统计查询语言,De Goes 谈到:“Quirrel 很多方面都与 R 编程语言比较相似。像 R 一样,Quirrel 也是为高级的分析与统计而设计的。但与 R 不同的是,Quirrel 并非图灵完备的语言,它是纯声明式的,利用它更容易高效地在大规模集群的机器中分发 Quirrel 查询(这也使 Quirrel 比 R 更容易学习)。”

PrecogDB 有一些“用于常见的分析与统计计算的内置例程”,它还提供了一个“细粒度的、基于能力的安全模型,支持来自移动设备或 Web 的应用程序通过 RESTAPI 直接访问其功能”。

查看英文原文 Precog: Big Data Analytics as a Service


感谢侯伯薇对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2012-10-11 01:514644
用户头像
臧秀涛 略懂技术的运营同学。

发布了 300 篇内容, 共 150.5 次阅读, 收获喜欢 35 次。

关注

评论

发布
暂无评论
发现更多内容

C#中IsNullOrEmpty和IsNullOrWhiteSpace的区别?

追逐时光者

C# .net 微软

使用 xUnit 快速编写 .NET 应用单元测试

追逐时光者

C# .net 微软 单元测试

一个开源免费、功能丰富的 WPF 自定义控件资源库

追逐时光者

C# .net 微软 WPF

2个 GitHub 实用辅助神器,帮你快速了解和上手 GitHub 开源项目(附带GitHub加速器)!

追逐时光者

GitHub

一个遵循 Material Design 设计规范、开源免费的 Blazor 组件库

追逐时光者

C# .net 微软

一套基于 .NET 开源的低代码、权限、工作流、动态接口平台

追逐时光者

C# .net 微软

一个基于 .NET 开源、便捷、高效的远程桌面控制工具

追逐时光者

C# .net 微软 远程工具

Visual Studio 2022 中的 EF Core 反向工程和模型可视化扩展插件

追逐时光者

.net 微软 Visual Studio

2025 年实用、全面的 VS Code 插件推荐!

追逐时光者

Visual Studio

一款实用的 Visual Studio 发布部署插件,助力提高部署效率!

追逐时光者

.net 微软 Visual Studio 2022

一款超级经典复古的 Windows 9x 主题风格 Avalonia UI 控件库,满满的回忆杀!

追逐时光者

C# .net 微软

Visual Studio 现已支持新的、更简洁的解决方案文件(slnx)格式

追逐时光者

C# .net 微软 Visual Studio 2022

一款由网易出品的免费、低延迟、专业的远程控制软件,支持手机、平板、Mac 、PC、TV 与掌机等多设备远控电脑!

追逐时光者

远程连接工具 开发效率工具

一个基于 .NET 8 + Ant Design Blazor 开发的简洁现代后台管理框架

追逐时光者

C# .net 微软

不写一行代码 .NET 使用 FluentCMS 快速构建现代化内容管理系统(CMS)

追逐时光者

C# .net 微软 CMS

DDD本质论:从哲学到数学,再到工程实践的完整指南之理论篇

canonical

领域驱动设计 DDD 领域模型 可逆计算

使用Quarkus构建首个Keycloak MCP服务器实战指南

qife122

Quarkus MCP

Exchange安全漏洞分析:ProxyOracle攻击链详解

qife122

网络安全 exchange

精选 5 款 .NET 开源、功能强大的工作流系统,告别重复造轮子!

追逐时光者

C# .net 微软

GitHub 汉化神器,2步快速解锁中文化 GitHub 界面!

追逐时光者

GitHub

提高 .NET 编程效率的 Visual Studio 使用技巧和建议!

追逐时光者

.net 微软 Visual Studio 2022

推荐 3 种 .NET Windows 桌面应用程序自动更新解决方案

追逐时光者

C# .net 微软

一种更简单的方式运行 C# 代码,简化 C# 开发体验!

追逐时光者

C# .net 微软

一款轻量、友好、跨平台的 .NET SDK 管理工具

追逐时光者

C# .net 微软

一款基于 .NET 开源免费、轻量快速、跨平台的 PDF 阅读器

追逐时光者

C# .net 微软

.NET 使用 DocNET 库快速高效的操作 PDF 文档

追逐时光者

C# .net 微软 PDF

使用 OpenAuth.Net 快速搭建 .NET 企业级权限工作流系统

追逐时光者

C# .net 微软 权限管理系统

.NET应用中的高效分布式同步解决方案

追逐时光者

C# .net 微软

一款开源免费、通用的 WPF 主题控件包

追逐时光者

C# .net 微软 WPF

一个基于 .NET 8 开源免费、高性能、低占用的博客系统

追逐时光者

C# .net 微软 博客系统

EF Core 10 现已支持 LeftJoin 和 RightJoin 运算符查询了!

追逐时光者

C# .net 微软 EF Core

Precog:大数据分析即服务_DevOps & 平台工程_Abel Avram_InfoQ精选文章