HarmonyOS开发者限时福利来啦!最高10w+现金激励等你拿~ 了解详情
写点什么

姜小凡:物理世界的数据越来越有价值

  • 2014-03-03
  • 本文字数:2602 字

    阅读完需:约 9 分钟

进入二月下旬,北京迎来一轮漫长的雾霾天气,京东上许多空气净化器脱销,淘宝上 3M 口罩涨价不少,微博、微信上也流传着各种应对 PM2.5 的偏方。在未来的日子,我们不得不继续 PM2.5 问题。2013 年,姜小凡和他的团队开发了一款成本 200 多元的 PM2.5 检测设备——PAM(便携式个人空气质量监测仪)。PAM 最大的特点是成本低。同时,PAM 考虑了地理信息、气候因素,并且通过机器学习的方式处理这些数据,建立模型,模型进一步修正数据,保证数据精确性。

QCon 北京 2014 大会上,姜小凡将就《PM2.5 的大数据分析》为题分享,详解如何将廉价的传感器与云端数据结合实现 PM2.5 分析的。日前,InfoQ 对姜小凡进行了专访,以下为采访内容:

InfoQ:姜小凡你好,向 InfoQ 的读者和 QCon 的参会者介绍下自己吧。

姜小凡:我是 Intel 物联技术研究院的首席构架师,也是 Intel 研究院的主任研究员。最早我在伯克利读本科和博士,期间开始接触物联网这个方向,做了一些无线传感器网络和楼宇能源监测及管理的项目。在博士期间我也做了一些能源控制的 startup,并也在美国的 Google 做了一些 MIMO 通信的研究。毕业之后我加入了微软亚洲研究院,那时候我主要研究移动互联网、室内定位等。2012 年底我再次加入了 Intel,为什么说我再次加入呢,是因为我本科毕业的时候,在加州那边的英特尔也工作过一段时间。自 2012 年底到现在,我们对很多领域的技术进行了探讨,并对其中一些进行了深入研究。其中一个项目是利用物联网和大数据手段做空气质量检测,如 PM2.5 和雾霾。

InfoQ:目前你关注的重点是什么?

姜小凡:把物联网技术真正应用到生活中,把技术真正推向市场并解决一些问题,是我们研究院所有人共同的目标,也是我们关注的重点。对于我个人来说,刚刚说的 PM2.5 和雾霾问题是我目前一个很重要的关注点。现在有各种手段做 PM2.5 监测,但是这些方式要么非常昂贵,要么很不精确。而我们利用比较廉价的传感器网络能实时的把颗粒物的数据传到云端,同时收集了不同维度的其他数据,包括气象数据,人的位置数据等,将这些数据融合在一起。最后用机器学习的方式处理这些数据,找到他们之间的关系,学习出不同维度数据互相的影响。通过这种方式,在云端做了空气模型,再通过这个模型增加数据的精确性。我认为这是一个非常经典的物联网和大数据的结合的项目,也希望能够向 QCon 的听众介绍这个项目。

当然我们不仅仅有空气质量方向的研究,我们也做一些可以快速应用的项目,我可以列举几个。如手机验真。现在国内的手机是有很多是仿品,怎么用数据和众包的方式自动检测到手机的真伪?这就涉及到手机硬软件的“指纹”收集,我们在云端建立了一个比较大的数据库,能收集到很多款 Android 手机的指纹。不同的操作系统,不同的软件版本会生成不同的指纹,通过指纹的方式非常简单的告诉消费者,你买的手机是正品还是仿品。

在室内定位方面,我们和海龙大厦合作,通过无线信号指纹的手段定位。这样,我们知道某个消费者时时的精确位置。基于位置信息,可以给消费者提供一些帮助,比如说室内导航,广告的推送。

此外还有一些其他的项目,包括我们在公交车做了人流的监测和预测,希望解决交通拥堵的问题。基本上我们现在都是比较实际的问题,希望用大数据、云计算的手段去解决这些问题,而不是花更多的钱去买一个更精确的传感器。我认为这是一个正确的方向。

InfoQ:海龙大厦室内定位是通过 WiFi 信号实现的吗?

姜小凡:是通过 WiFi,这个技术在学术界已经有不少论文,但我们还没有看到很多真正的商业应用。我们这里要做的,不是去发论文讨论如何实现,或是如何添加一个什么创意来改进,而是真正将 WiFi 室内定位推进到应用的层面,我们知道任何一个实验室技术和真正实用化相比还有很大差距的,面对的问题也有很大区别。实验室关注的是可行性,可以对很多条件进行限定;但实际上很多条件是不可预知的,实际应用有太多的细节和技术难关需要解决。

InfoQ:在过去一年当中,你观察到数据行业有哪些变化?

姜小凡:开始的时候,大家都觉得大数据要像亚马逊、沃尔玛、Google 这些公司那样收集了很多信息,然后通过模型或分析找到可利用的信息。很多人把大数据和 Hadoop 之类的技术划上等号,拿数据量来标榜大数据。而我的看法却不同,我认为大家越来越关注小数据的集合,为什么呢?之前一般直接从互联网提取数据,但是近一两年,看到的是很多物理世界的数据,比如手机里的加速度传感器的数据,GPS 数据,PM2.5 数据。这些和物理世界相关的数据越来越多,而且越来越有价值。我认为我们会渐渐把大数据的概念扩展,把空间信息、地理位置信息等 meta data 都加入进去。而我们更关注的不是数据本身,而是数据之间的关系和它们的相互作用。建立数据之间的关系是有难度的,处理起来也更加复杂。如在实时系统中,留给数据分析和反馈至前端的时间也许只有 10 毫秒,如何利用流处理和系统优化来达到,这是我们需要深入研究的。

InfoQ:你怎么理解大数据处理与大数据应用?

姜小凡:大数据处理方面,大家都认为大数据应该在云端做,但我觉得数据的处理应该是分布式的,我指的不仅是数据中心分散计算能力,而是数据应该在最利于处理的地方处理。比如,如果需要把所有数据以原始的状态发送到云端处理,对网络的压力是非常大的。所以我认为大数据处理,可以在例如手表之类的地方处理再发送到云端,比如视频数据会在摄像头内做一些特征提取,然后再把特征发送到云端。

大数据应用有一些经典的例子,比如通过数据分析知道用户在某一时间点喜欢购买的商品,超市可以通过预测来提前订货。在移动应用方面,刚才提到了在海龙大厦的室内定位就是其中之一。

InfoQ:您曾经说过,希望把 PAM 传感器的价格降到两三百元人民币,这个目标还需要多久才能实现?

姜小凡:这个目标在有一定生产量的前提下已经实现了。具体生产量是多少,我们还在进行核算,不过这个量应该不是很大。

InfoQ:通过大量廉价的传感器搜集数据是未来实现大数据应用的有效手段吗?这其中的难点在哪儿?

姜小凡:这里的挑战包括数据的可用性,精确性,以及把数据提取到云端的过程耗费的系统资源。以 WiFi 定位为例,原理上大家都理解,通过收集某一点的 3 个 AP 的信号强度,用三角定位实现。但在真实环境,无线信号波动非常大,遮挡物会改变信号强度,信号可能被反射和散射 ,造成信号强度衰减或者增递。物理世界的传感器数据,并没有互联网数据那么干净,需要大量的处理把传感器数据变成可用的数据。

2014-03-03 02:061780
用户头像

发布了 45 篇内容, 共 14.0 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

想听世界上最懂 JavaScript 的人和你讲JavaScript 吗?

博文视点Broadview

浪潮云说丨数据工场助力行业数据发挥生产要素新价值

云计算

【Flutter 专题】108 图解 PageView 滑动页面预览小尝试

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 6月日更

ONES CTO 冯斌 | 项目管理是软件研发的刚需

万事ONES

项目管理 研发管理 ONES

一文回顾 Java 入门知识(下)

逆锋起笔

Java 面向对象 JAVA开发 java基础 javase

Scrum为何倡导固定迭代周期?

万事ONES

项目管理 Scrum 敏捷开发 Agile ONES

6月18日华为云携手中科院上海药物所,深度解读AI药物研发技术

华为云开发者联盟

AI 华为云 药物 TechWave EIHealth

动态规划最长公共子序列(LCS)问题(Java实现)

若尘

动态规划 java编程 6月日更

PHP ppa 不再支持过时的 Ubuntu 16.04,请立即升级 20.04

大龄程序员老羊

php ubuntu 架构 DevOps

Hi,HarmonyOS!融云全系产品已成功适配鸿蒙 OS 2.0

融云 RongCloud

我的编辑器能玩贪吃蛇,一起玩不?

华为云开发者联盟

大前端 编辑器 贪吃蛇 Blot Quill

读深入ES6记[三]

蛋先生DX

ES6 6月日更

并发王者课-青铜10:千锤百炼-如何解决生产者与消费者经典问题

MetaThoughts

Java 多线程 并发

液体测量技术:从水到血液

不脱发的程序猿

物联网 液体测量技术 测量技术 ADI

如何用Python快速的搜索邮件

IT蜗壳-Tango

6月日更

【LeetCode】零钱兑换 IIJava题解

Albert

算法 LeetCode 6月日更

网络攻防学习笔记 Day40

穿过生命散发芬芳

网络攻防 6月日更

springboot启动流程之createApplicationContext

梦倚栏杆

手撸Spring框架,设计与实现资源加载器,从Spring.xml解析和注册Bean对象

小傅哥

spring 小傅哥 资源加载器 解析xml 注册Bean对象

聊聊Go的包管理

架构精进之路

包管理工具 Go 语言 6月日更

深圳站 | 鹏城再聚,赋能未来,金沙古酒百城巡展第39站完美收官!

科技热闻

ONES CTO 冯斌 | 高效研发团队的技术管理之道

万事ONES

管理 研发管理 技术管理 ONES

情感分析 | AI没有“心”,却能“读心”

澳鹏Appen

人工智能 自然语言处理 机器学习 nlp 训练数据

融合创新与头雁领路:通过北京人工智能产业联盟能读懂什么?

脑极体

并发王者课-青铜9:防患未然-如何处理线程中的异常

MetaThoughts

Java 多线程 并发

教你在Kubernetes中快速部署ES集群

华为云开发者联盟

Kubernetes 监控 中间件 集群 ES集群

Java 并发编程—— ThreadPoolExecutor 分析应用

Antway

6月日更

CloudQuery 的数据安全技术运用

BinTools图尔兹

Java 数据库 sql 数据安全

分布式系统中的ID是如何生成的

卢卡多多

电商 分布式ID 6月日更 签约计划第二季

工厂管理没有头绪?那是你还没有可视化操控设备

一只数据鲸鱼

数据可视化 工业互联网 工业4.0 智慧工厂

WebRTC 用例和性能

anyRTC开发者

音视频 WebRTC RTC sdk

姜小凡:物理世界的数据越来越有价值_QCon_包研_InfoQ精选文章