InfoQ Geekathon 大模型技术应用创新大赛 了解详情
写点什么

纽约时报实验室引入了可视化流处理工具

  • 2014-04-21
  • 本文字数:937 字

    阅读完需:约 3 分钟

纽约时报研发实验室已经发布了Streamtools ,一个通用的处理数据流的图形化工具。

纽约时报实验室负责Streamtools 项目的 Mike Dewar 阐述了该项目的动机:

在过去的 20 多年中,我们已经在处理列表数据的工具上投入了大量资金,从 Excel、MySQL、MATLAB 到 Hadoop、R 和 Python+Numpy。在面临无穷无尽的数据时,这些工具都有种种不足并减弱了我们的创新潜力。为了克服这些不足,我们研发了 Streamtools。

Streamtools 提供了一个能够在浏览器中运行的 GUI,用户可以用它来探究、分析、更改数据流,并从中学习。Streamtools 所定义的操作词汇非常简单:数据通过连接在块之间流动。它们可以互相连接起来共同创建实时数据处理系统,既不需要编程,也不需要复杂的基础设施:

  • 一个块在它所接收的所有消息上执行一些操作,而每个块的类型决定了其可以执行的操作。
  • 每个块拥有零个或多个规则来定义自己的行为。
  • 每个块都拥有一个命名的路由集,这些路由可以接收数据、发送数据或者响应查询。
  • 块之间可以通过路由互联,就是使用连接。
  • 连接块组成的集合称之为模式,我们可以借助于 JSON 格式的描述文档从一个运行的 Streamtools 实例中导出或者导入其所有的模式。

Streamtools 使用 Go 编写,后者是 Google 发明且日益流行的编程语言。Streamtools 可在 Apache 2 许可证下通过 GitHub 获得。Dewar 解释了选择 Go 的理由

我们之所以选择 Go,是因为使用它编写的代码很贴近我们试图呈现给用户的习语。所以每个块都是自己单独的 goroutine,而每个连接都是一对管道。这是个非常简单的抽象,我们希望藉此能让用户很好地理解自己所构建的系统。也就是说编写新块的工作是非常简单的,我们希望这能鼓励社区积极创建他们认为有用的块。同时,使用 Go 还可以写出安全、高性能的代码,这对于我们在纽约时报的日常工作来说很不错。

纽约时报实验室的 Streamtools 团队认为基于流的 API 将会变得更加普遍,同时流的使用改变了我们得出关于这个世界种种结论的方式。

查看原文链接: New York Times Lab Introduces Visual Stream Processing Tool


感谢孙镜涛对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

活动推荐:

2023年9月3-5日,「QCon全球软件开发大会·北京站」 将在北京•富力万丽酒店举办。此次大会以「启航·AIGC软件工程变革」为主题,策划了大前端融合提效、大模型应用落地、面向 AI 的存储、AIGC 浪潮下的研发效能提升、LLMOps、异构算力、微服务架构治理、业务安全技术、构建未来软件的编程语言、FinOps 等近30个精彩专题。咨询购票可联系票务经理 18514549229(微信同手机号)。

2014-04-21 09:072038

评论

发布
暂无评论
发现更多内容

【Nacos配置管理】一文带你搞懂Nacos配置管理模块

石臻臻的杂货铺

nacos

DR Auto-Sync 的 ACID 恢复功能简介和长期断网应急处理方案

TiDB 社区干货传送门

管理与运维 数据库架构设计

机房搬迁更改集群IP

TiDB 社区干货传送门

【ha知识两问】ha软件是什么?ha软件用途有哪些?

行云管家

高可用 ha 日志审计 双机热备

Apipost预执行脚本使用教程

徐天

构建工具tsup入门第一部分

小鑫同学

前端 编译 工具链

小白科普丨何为树、二叉树和森林

华为云开发者联盟

开发 华为云 企业号 2 月 PK 榜 华为云开发者联盟

大数据软件开发培训中心哪家好

小谷哥

PingCAP 黄东旭万字长文剖析数据库发展新趋势:脱离应用开发者的数据库,不会成功

TiDB 社区干货传送门

数据库前沿趋势

DR Auto-Sync 搭建和灾难恢复手册

TiDB 社区干货传送门

管理与运维 数据库架构设计

品牌不得不投放户外LED广告的原因

Dylan

LED显示屏 户外LED显示屏 led显示屏厂家

前端培训机构毕业后该注意什么?

小谷哥

通过Jmeter批量向TiDB数据库插入数据

TiDB 社区干货传送门

性能调优 实践案例 管理与运维 安装 & 部署 数据库连接

webhook告警配置

TiDB 社区干货传送门

墨天轮《2022年中国数据库行业年度分析报告》正式发布,精彩抢先看

墨天轮

数据库 Serverless 云原生 国产数据库 HTAP

ChatGPT3.5 !微软最新官宣整合OpenAI的14个产品细节,改变从视频会议Teams开始

B Impact

通过Jmeter对TiDB数据库进行压测

TiDB 社区干货传送门

监控 性能调优 实践案例 故障排查/诊断 安装 & 部署

TiDB 的数据加载性能调优方案

TiDB 社区干货传送门

性能调优 应用适配

Cloud + TiDB 技术解读

TiDB 社区干货传送门

TiDB Operator--K8S集群基础环境配置

TiDB 社区干货传送门

实践案例 集群管理 管理与运维 安装 & 部署 扩/缩容

【计算讲谈社】第十六讲|当我们在谈目标时,究竟在谈什么?

大咖说

深入浅出学习透析Nginx服务器的架构分析及原理分析「底层技术原理+运作架构机制」

C++后台开发

nginx 负载均衡 中间件 后端开发 Linux服务器开发

2023年知名堡垒机厂商及价格简单说明

行云管家

网络安全 信息安全 数据安全 堡垒机

为啥要对jvm做优化

华为云开发者联盟

开发 华为云 企业号 2 月 PK 榜 华为云开发者联盟

Grafana组件升级和离线镜像源

TiDB 社区干货传送门

监控 版本升级

Apipost产品介绍

徐天

软件测试/测试开发 | app自动化测试(Android)—Capability 使用进阶

测试人

软件测试 自动化测试 测试开发 appium app自动化测试

看板:自我管理的高效工具!

敏捷开发

项目管理 软件开发 看板

前端技术培训学习的就业怎么样?

小谷哥

云小课|GaussDB如何进行性能调优

华为云开发者联盟

数据库 后端 华为云 企业号 2 月 PK 榜 华为云开发者联盟

基于ModelArts进行流感患者密接排查

华为云开发者联盟

人工智能 华为云 行人检测 企业号 2 月 PK 榜 华为云开发者联盟

  • 扫码添加小助手
    领取最新资料包
纽约时报实验室引入了可视化流处理工具_语言 & 开发_Michael Hausenblas_InfoQ精选文章