写点什么

QuantCell Resarch 发布首款 Java 大数据电子表格 beta 版本

  • 2013-09-23
  • 本文字数:2773 字

    阅读完需:约 9 分钟

以大数据分析起家的 QuantCell Reaearch 最近发布了首个他们称作“大数据”表格的公开 beta 测试版本。

乍一看,人们可能会认为 QuantCell 是其他电子表格应用的 Java Swing 版本。但实际上它是早在 1970 年底就出现的商用电子表格软件 VisiCalc 发展而来的最新版本,目前这一市场由 Microsoft Excel 占领,当然,Excel 无疑是最广泛使用的计算机程序之一。

之前的电子表格受到行、列以及由程序员掌控的函数等方面限制,QuantCell 之所以得到扩展,得益于其对 Java 和 JVM 语言的掌握。最近,QuantCell 又发现了自己在大数据方面的用武之地,它提供的模版可将 Map 和 Reduce 公式输入到电子表格中。

大部分 QuantCell 基本表格不但能接收传统电子表格的函数,也能接受 Java(或者 Scala 或 Jython、R)对象的实例。

下面是一个 Java 伪代码示例:

复制代码
a1 <- new String("MM-dd-yyyy") // Store format mask
a2 <- new SimpleDateFormat(a1) // Store formatter
a3 <- new Date() // Store the date
a4 <- a2.format(a3) // Store the formatted string representation of the date.

所以,a4 单元格能正确地引用 a3 和 a2,并能间接地引用 a1。

图1是上述例子的实际截图。(注意,Java 构造器语法中没有使用“new”操作符。同时,在公式区域中,a4 单元格的公式中,(*) 运算符引用的参数代表的是当前单元格。

InfoQ 为此采访了 QuantCell 的联合创始人 Kris Thorleifsson 和 Agust Egilsson。

InfoQ:你们将QuantCell称作“大数据电子表格”。能否解析下在大数据分析方面QquantCell**** 所起的作用?

QuantCell: QuantCell 支持大数据框架、Apache Hadoop 的安装及实时大数据分析。它允许用户构建 MapReduce 算法,使用 Hive 和其他 JDBC 兼容的系统和数据库进行分析,使用相关的 SQL 或 NoSQL 语法创建实时查询,而这些都能从电子表格界面中实现的。另外,QuantCell 允许用户将分析提交到 Hadoop 服务器或其他大数据系统,并能查看其处理过程。QuantCell 提供部署路径能自动化大部分大数据部署任务。它自动交付算法和用来创建大数据任务和分析的框架。QuantCell 通过代码助手和向导辅助创建分析。

InfoQ: 你们的目标用户群体是哪些?

QuantCell: QuantCell 的目标用户群是那些领域专家,如数据科学家、金融工程师和研究人员、以及分析结果的消费者(如决策者和管理者)。QuantCell 对开发者来说也是非常有用的,因为它能让开发者通过通过基于表达式的方法快速实现原型,而无需过多考虑界面设计,所以能快速将方案投入生产环境。

InfoQ: QuantCell 如何帮助终端用户,他们并非熟练的程序员?

QuantCell: 我们努力提高见效周期以帮助终端用户应对挑战。首先,通过扩展 QuantCell 电子表格来支持功能强大的编程语言,如 R、SQL、Scala、Jython 和 Java 代码片段。此外,我们为领域专家、数据科学家和非开发人员至少降低了四个方面的障碍:

  • QuantCell 简化了数据的访问和计算周期
  • 简化了代码,有时候不需要编码
  • 自动向生产环境部署解决方案
  • 自动访问外部资源并实现算法及方法

当然,减低上述的障碍并不容易,我们将继续在 QuantCell 上改善我们的方法。

InfoQ:你们提到数据科学家。请谈谈如何支持这类用户?

QuantCell: 除了简化大数据分析和减少大数据项目的成效周期之外,我们倾听用户,并努力确保 QuantCell 能支持并方便用户得到最常用的大数据环境。部署功能是 QuantCell 与生俱来的,我们提供特定于各种大数据环境部署路径。因为部署是复杂的,并且与特定的环境相关,所以这是我们主要的努力方向。与此同时,对于数据科学家来说,能够轻松地将大数据解决方案部署到不同的生产环境中是很有价值的,比如,从原型到生产环境迁移时,无需重写代码。

InfoQ: 目前 QuantCell 有什么可用的分析类库和工具?

QuantCell: 所有根据 Apache Maven/Ivy 标准赋值的元数据的 Java 类库都可直接在 QuantCell 上使用——通常只需一两次点击。这是很重要的,因为它意味着 QuantCell 能使用户根据需要直观地访问成千上万的类库和工具,差不多数以亿计的算法,都可直接在电子表格中的界面上获得。例如,Maven 主搜索目录中的算法、用户自己的类库、开源的 Cloudera 的 Hadoop 发行版、财务和风险分析方面的 OpenGamma 平台、机器学习方面的 Weka、生命科学中的 BioJava、彭博的开放市场数据、亚马逊的 Web 服务等等。此外,它们还提供了各类可视化工具,以展示各自的数据处理特性,所以它们不仅增强 QuantCel 的功能,还提供了可视化查看数据及结果的功能。

InfoQ:QuantCell**** 中怎么处理大数据集的?

QuantCell: QuantCell 用户可以连接到大多数数据源,无论是公共数据提供者,还是使用 JDBC SQL 或 NoSQL 的私有数据库,也可以连接到我们上文中提到的 Hadoop 节点。大数据集通常集中管理,过于庞大而难于迁移,所以在单元格中用对象来表示它们是理想的,这也是 QuantCell 所采用的方法。用户只需引用包含数据对象的单元格,并在某些分析或模型中引用它们。

InfoQ: 在高性能环境中 QuantCell 的表现如何?

QuantCell: QuantCell 模型的性能继承于 Java 平台。因此,在本地 JVM 中运行时,其速度和其他 Java 代码是一样的。特别地,该模型得益于实时(JIT)编译模型和其他 JVM 平台的优化方法。因此,QuantCell 能给电子表格用户带来更多 Java 计算平台的特性,如即时编译、垃圾收集和并发等。对于计算密集型任务,QuantCell 的模型利用了私有云和公共云、Hadoop、Amazon Web 服务和其他 HPC 系统

InfoQ:能否介绍后续计划?

QuantCell: 我们将改进对 R、Jython 和 Scala 的支持。我们也正在努力提高代码建议功能,并基于机器学习算法改善公式完成方法。同时我们正在尝试增加我们支持的部署路径,以上只是一部分。

关于两位创始人的一点历史:Agust Egilsson 是一位架构师、首席开发人员和技术推广者,从加州大学伯克利分校获得数学博士学位,有着投资银行家的学术和实战背景。Thorleifsson 来自 Sun 公司,目前负责产品管理和营销。

Egilsson 在 2006 年和 2007 年期间构建了该系统的早期原型,并在其工作中使用这些系统构建了基于 Java 的交易策略和风险分析系统。

在 2010 和 2011 年使用 JavaFX 重新编写了 QuantCell 的客户端之后,他们发布了早期的测试版本以获得用户的反馈,此后他们持续改进产品,直到日前刚发布的首个公开 beta 版。

读者可以从去年Java 杂志的推荐文章 JavaOne 2012 上 QuantCell 的演讲中了解更多相关知识。还可以从下载页面中下载Windows 版本。稍候将发布Mac 的版本。

查看英文原文: QuantCell Research Announces First Public Beta of their Java-Aware Big-Data Spreadsheet


感谢马国耀对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2013-09-23 08:161270
用户头像

发布了 81 篇内容, 共 25.8 次阅读, 收获喜欢 5 次。

关注

评论

发布
暂无评论
发现更多内容

如何快速做一个优美的网站?

coxi_vv

开源 建站 网页 halo博客 1Panel

实训机房用什么样的云桌面系统合适?

上海锐起科技

秒验合规指南

MobTech袤博科技

开发者

火山引擎携手领克汽车与英特尔,发起首届AI创造者大赛

新消费日报

抖音集团 FlinkSQL 性能优化探索及实践

字节跳动数据平台

flink 云服务 火山引擎 流式计算

豆包大模型综合能力提升20.3%,火山引擎成立零售大模型生态联盟,加速企业AI落地

新消费日报

流程挖掘,为光伏企业重塑确定的竞争力

望繁信科技

数字化转型 流程挖掘 流程智能 光伏企业

5个Spring 异步与事件注解:解耦与高性能注解应用案例(必须收藏)

肖哥弹架构

spring Spring Boot 异步 事件

「模型量化技术」可视化指南:A Visual Guide to Quantization

Baihai IDP

AI 模型量化 白海科技 LLMs 企业号 8 月 PK 榜

Winclone Pro——专业级Windows虚拟机克隆与恢复工具

Rose

Winclone Pro Windows系统备份

秒验SDK扩展业务功能设置

MobTech袤博科技

开发者

PYUSD跃升为第六大稳定币:借势Solana和高APY的成功之道

区块链软件开发推广运营

交易所开发 dapp开发 区块链开发 NFT开发 公链开发

强化远程管理安全:SecureCRT——您的首选SSH客户端与终端仿真器

Rose

SecureCRT Mac破解版 终端仿真软件

NTFS 磁盘管理器NTFS Disk by Omi NTFS 安装简单 完美支m1/m2

Rose

Omi NTFS磁盘管理助手 NTFS Disk by Omi NTFS NTFS 磁盘管理器 Omi NTFS

基于Java的XML编辑器 Oxygen XML Editor for Mac

Rose

Oxygen XML Editor XML开发

主要根据什么因素选择云堡垒机规格?

行云管家

云计算 数据安全 云堡垒机 云数据

Project Office Pro:一站式项目管理解决方案,让工作更高效!

Rose

观测云产品更新 | 异常追踪、数据保存策略、BPF 日志、管理优化等

观测云

产品迭代

Microsoft 365 有什么用?microsoft 365永久激活密钥

Rose

Acrobat pro Dc 2023中文直装安装包 附Mac版和win版激活补丁

Rose

人工智能时代:哪些职业将被取代,哪些职业难以替代?

天津汇柏科技有限公司

人工智能

Auto Mouse Click 直装版 Mac高效稳定的鼠标连点器

Rose

得物App白屏优化系列|网络篇

得物技术

android 企业号2024年8月PK榜

Photoshop 2024最新版详细安装教程 附mac版和win版安装包

Rose

办公必备软件 PDF Reader Pro for mac 全能pdf编辑

Rose

PDF Reader Pro破解 PDF编辑软件 PDF Reader Pro

从海量信息中脱颖而出:Workflow智能分析解决方案,大语言模型为AI科技文章打造精准摘要评分体系(总篇章)

汀丶人工智能

人工智能 智能问答

MIAOYUN与CStack签署总代协议,共拓一体化云端交互管理市场!

MIAOYUN

云计算 云原生 云服务 云桌面 战略合作

解锁未来财富密码:AI 自动化副业创收班 - 终身财富加速器

测试人

软件测试

秒验集成指南

MobTech袤博科技

开发者

DOGS空投掀起交易所竞争热潮,TON生态能否再次引爆市场?

区块链软件开发推广运营

区块链开发 链游开发 NFT开发 公链开发 dapp项目开发

QuantCell Resarch发布首款Java大数据电子表格beta版本_Java_Vikram Gupta_InfoQ精选文章