【AICon】 如何构建高效的 RAG 系统?RAG 技术在实际应用中遇到的挑战及应对策略?>>> 了解详情
写点什么

知道大数据却不清楚工业大数据,知识架构“欠”在哪里?

  • 2019-04-03
  • 本文字数:2110 字

    阅读完需:约 7 分钟

知道大数据却不清楚工业大数据,知识架构“欠”在哪里?

我国的工业互联网发展正在从概念的普及进入实践的生根阶段,在这一进程中,数据成为重要的基础性战略资源。大数据的充分挖掘和利用,极大促进了全社会要素资源的网络化共享、集约化整合、协作化开发、高效化利用,推动了中国工业发生重大而深刻的变革,一个全新的大数据时代正在向我们大踏步地走来。

工业数据量激增背景下的数据处理

目前,大数据正处于融合发展和变革创新的重要关口:工业数据量激增,互联网、移动互联网、物联网三大生态顺次发展,使得全球数据总量爆发性增长。到 2020 年,数据总量将达到 44ZB(万亿 GB),其中工业数据增速将是其它大数据领域的两倍;软件、网络、装备等各领域间技术频繁发生跨界耦合交融,依托数据的整合作用,推动产品与服务、硬件与软件、应用与平台趋向交融;全球产业格局面临重塑,传统大数据 IT 企业、自动化企业、制造企业正在成为工业大数据这一新兴领域的领导力量,以融合性技术创新和新兴产业生态体系为标志的产业新格局正在形成中。


工业大数据从来源上主要分为信息管理系统数据、机器设备数据和外部数据。信息管理系统数据是指传统工业自动控制与信息系统中产生的数据,如 CRM、ERP、MES 等。机器设备数据是来源于工业生产线设备、机器、产品等方面的数据,多由传感器、设备仪器仪表进行采集产生。外部数据是指来源于工厂外部的数据,主要包括来自互联网的市场、环境、客户、政府、供应链等外部环境的信息和数据。


工业大数据的实践落地高度依赖行业经验与人工智能等数据科学的融合,通过将行业知识、经验固化到软件中,实现对工业场景中面临的不确定性实现更加有效地管理,形成数据驱动、快速迭代、持续优化的工业智能系统。

工业智能技术实现的关键步骤

在 2015 年通用电气(General Electric)推出 GE Digital 时,GE Digital 的 CTO Harel Kodesh 就提出过:工业数据不准确、工业智能对风险控制和响应能力的高要求、终端处理能力的限制、复杂模型必须被解释等导致了在数据、算法和模型训练上工业智能所要开辟的一些「新领域」。


天泽智云首席架构师朱武曾在 InfoQ 刊发过的文章《海阔凭鱼跃:记一场工业场景下的 AI 技术实践》采访中提到,工业数据的多源性、复杂性和动态性强,比如柴油机气缸排气温度,取决于燃油、燃烧、进气温度、封闭性等等原因,导致工业智能背后数据特征提取、建模等层面的技术挑战。因此,特征提取要求在高背景噪声下必须实现准确且快速的降维。另外,在数据建模及训练层面,工业应用的碎片化、个性化以及结果的专业性,需要建模及训练在整体和个体、通用性和个性化之间取得均衡。


从工程实现的角度,工业智能实现的关键有如下几步:


1、定义工业场景:正如上文所提及,问题域所涉及工业场景定义的准确性和完备性决定了该问题在多大程度上被解决的可能性;


2、数据的完备性和质量:工业现场数据一般带有很多噪声,而数据范围和质量决定了后续处理的难易程度和最终结果的准确性;


3、智能应用支撑环境:工业智能应用本身就具备碎片化、个性化、专业化的特点,如何提供快速有效的应用实施环境,包括数据环境、模型研发实验环境、应用部署环境等,决定了工业智能应用的推广和客户接受速度。


依照富士康工业互联网副董事长李杰教授、天泽智云 CTO 刘宗长共同发表的《工业大数据:挖掘“不可见世界”中的价值》一文中的阐述,CPS 是一个具有清晰架构和使用流程的技术体系,针对工业大数据的特点和分析要求所构拟的技术体系,其能够实现对数据进行收集、汇总、解析、排序、分析等全套处理流程,实现对工业数据进行流水线式的实时分析能力,并在分析过程中充分考虑机理逻辑、流程关系、活动目标、商业活动等特征和要求。因此可作为工业大数据分析中的智能化体系的核心。



CPS 的 5C 架构


工业大数据正是以行业模型为前提,将面向不同行业、不同场景、不同学科中的工业机理、专家经验、行业知识和最佳实践固化成为数据统计、挖掘和分析模型,将业务问题转化为数据可解的问题;以数据科学为基础,使得深度学习、迁移学习、强化学习等为代表的人工智能算法成为解决工业大数据领域诊断、预测与优化问题的得力工具;以软件服务为目的,形成可落地执行的工业大数据解决方案。


竞赛是推动创新探索、实践指导与人才发展的有效途径。美国早在 2008 年起开始探索通过竞赛方式促进大数据、人工智能与制造业融合,针对设备健康状态评估、剩余生命周期预测等问题进行方法研究和测试论证,涉及航空发动机、齿轮箱、风机测风仪、半导体、轨道交通等多个工业场景。GE 也曾经发起过多次数据竞赛,悬赏解决飞行路径规划、医疗大数据等问题,并获得解决实际问题的具体模型算法和专业人才。

他们如何看待智造时代下的大数据未来

为深度挖掘工业大数据的实际落地场景,探寻我国制造业转型升级的发展趋势,1 月 13 日,我们专程前往由工业和信息化部指导,中国信息通信研究院联合工业互联网产业联盟、华为、富士康、积微物联共同主办“第二届工业大数据创新竞赛”的决赛答辩现场。


在共同见证优胜团队诞生的同时,InfoQ 编辑在答辩现场也采访到了中国信息通信研究院总工程师余晓辉,富士康工业互联网副董事长李杰等重磅技术专家。那么,在新一轮的科技与产业变革中,他们是如何看待智造时代下的大数据未来呢?


00:00 / 00:00
    1.0x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    2019-04-03 15:568710
    用户头像

    发布了 35 篇内容, 共 21.4 次阅读, 收获喜欢 43 次。

    关注

    评论

    发布
    暂无评论
    发现更多内容

    内卷是必然

    ES_her0

    5月日更

    学习笔记之:05 | 数组:一秒钟,定义 1000 个变量

    Nydia

    学习

    梯度下降法 - DAY12

    Qien Z.

    5月日更 过拟合 梯度下降法

    虽不能至,心向往之|靠谱点评

    无量靠谱

    工业互联网平台赋能需充分挖掘数据价值

    浪潮云

    NLog整合Exceptionless

    yi念之间

    .net core exceptionless nlog

    打破固有思维(十六)

    Changing Lin

    5月日更

    WebContainers介绍:如何在浏览器运行原生的Nodejs

    代码先生

    大前端 webassembly 技术创新 WebContainers StackBlitz.com

    架构学习笔记:架构设计3原则

    风翱

    架构 5月日更

    人工智能--野人过河

    空城机

    Java 算法 5月日更 大学笔记

    关于爱情的碎碎念

    穿过生命散发芬芳

    520单身福利

    520有感而发

    yu

    520 单身福利

    kube-controller-manager之PV Cotroller源码分析

    良凯尔

    Kubernetes 源码分析 Ceph CSI

    多线程 VS 多进程(三)

    若尘

    多线程 Python编程 5月日更

    .Net Core Excel导入导出神器Npoi.Mapper

    yi念之间

    C# .net core npoi

    Flink的分布式缓存

    大数据技术指南

    flink 5月日更

    Docker 入门

    飞跃

    翻译:谁将在AI中赚钱?by Simon Greenman John 易筋 ARTS 打卡 Week 48

    John(易筋)

    ARTS 打卡计划

    华仔训练营模块4作业

    方堃

    拿金钱考验人性|靠谱点评

    无量靠谱

    架构实战营 模块四作业

    netspecial

    架构实战营

    Docker 镜像和容器

    飞跃

    Docker 520 单身福利

    分布式锁

    邱学喆

    分布式锁 redis分布式锁 zookeeper分布式锁

    Mac电脑:安装cnpm(补充步骤)

    三掌柜

    5月日更

    Node.js使用数据库LevelDB:超高性能kv存储引擎

    devpoint

    nodejs leveldb

    可以学习一下安全方面的知识

    escray

    学习 极客时间 安全 5月日更 安全攻防技能30讲

    【LeetCode】增长的内存泄露Java题解

    Albert

    算法 LeetCode 5月日更

    活性炭能去甲醛吗?

    小天同学

    科普 5月日更 活性炭

    分布式锁中的王者方案 - Redisson

    悟空聊架构

    redis 分布式 分布式锁 redisson

    设计千万级学生管理系统的考试试卷存储方案

    贯通

    架构实战营

    聊聊一个普通程序员在520这天的心态

    后台技术汇

    520 单身福利

    知道大数据却不清楚工业大数据,知识架构“欠”在哪里?_大数据_一点小小苏_InfoQ精选文章