写点什么

如何看待深度学习?

  • 2015-12-17
  • 本文字数:1041 字

    阅读完需:约 3 分钟

近来,深度学习成为一个流行词。有分析师认为,它会削弱现有机器学习方法的地位。实际上,深度学习并不是一个新概念,它是上世纪 90 年代就已经出现的人工神经网络(ANN)算法的一种扩展。由于ANN 需要极大的数据集用于训练,所以被边缘化了。深度学习算法为ANN 带来了新生,它会训练多层ANN,而所需的数据比先前的预期要少。近日,数据科学家Anubhav Srivastava撰文分享了一些有关深度学习的看法。

深度学习可以更好地通过增加数据集的规模来改善学习结果,这是人们需要这种算法的原因。在实际的解决方案中,深度学习更适合于未标记数据,而这超出了自然语言处理的范畴,后者更多限于实体识别。与传统的机器学习工具相比,深度学习挖掘了神经网络的潜力。基于强大的特征提取,它比其他工具更适合模式识别(图像、文本、音频)。

但是,深度学习并不会取代其他所有的机器学习算法。对于许多应用而言,一些简单点的算法(如逻辑回归、支持向量机)就已经足够。支持者之所以为深度学习而兴奋,一个基本的原因是,它是一种不同于线性或内核模型的元算法。这意味着,深度学习没有任何损失函数的特性,而且不受特定的公式限制,可以为科学家提供更大的灵活性。

有分析师认为,深度学习是最像大脑的算法,但Anubhav 认为这种观点有些片面,并以 Numenta 为例进行了进一步的阐述。Numenta“皮质(cortical)”算法基于分级时序记忆(HTM)模型,而后者是在“稀疏分布记忆(sparse distributed memory)”概念的基础上发展而来,那是一种学习人类长期记忆的数学模型。皮质算法既可以从空间维度,也可以从时间维度进行特征提取,使它更像是大脑的仿制品。

有鉴于此,Anubhav 认为,目前围绕深度学习和Numenta 的一些争论不甚合理。有种观点是,Numenta HTM 适合无监督学习,并将此视为其相对于深度学习算法的一个重大优势。还有一种观点是,Numenta 可以视为一种时间- 内存需求更小的在线学习算法。Anubhav 指出,有一个很重要的事实被忽略了,就是深度学习是一个多层模型。在多数情况下,神经网络模型一次只能求解一种问题类型,面对多种问题类型时,就需要使用混合模型。在这方面,深度学习算法的多层模型是一个巨大的优势,即使Numenta 也无法与其相比。


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群(已满),InfoQ 读者交流群(#2))。

2015-12-17 18:004982
用户头像

发布了 1008 篇内容, 共 392.8 次阅读, 收获喜欢 344 次。

关注

评论

发布
暂无评论
发现更多内容

全链路压测流量模型

FunTester

性能测试 全链路压测 FunTester 灰度分流 流量回放

小红书严惩刷量行为:如何才能优雅的种草

石头IT视角

程序员35岁后的发展,欢迎一起来讨论

hanaper

vue3,对比 vue2 有什么优点?

华为云开发者联盟

Vue Vue3 vue2 diff算法 渲染API

双赞的一体机主板能应用到哪些行业?

双赞工控

小白都能看懂的JVM知识,一文带你学会JVM内存模型!

华为云开发者联盟

Java JVM 内存管理 Java虚拟机 JVM内存模型

KubeVirt with YRCloudFile 擦出创新的火花

焱融科技

云原生 文件存储 虚拟化 高性能, 分布式存储,

模块3作业

Ping

什么是运维?怎样快速做好运维工作?

行云管家

云计算 运维 服务器 云运维

浅谈百度阅读/文库NA端排版技术

百度Geek说

大前端 百度文库

一萌妹子的面试经历,美团四面三小时,成功拿到Java岗offer

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

阿里大牛肝出的443页TCP/IP协议趣谈笔记,竟然在GitHub标星27k+

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

牛皮了!阿里大佬总结的图解Java手册在GitHub火了,完整版开源中

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

Python基础综合练习1

在即

9月日更

华为大神用前半生经验所写的SpringBoot全优笔记,现无偿与大家分享!

Java 华为 程序员 面试 计算机

恒源云(GpuShare)_GPU租用保姆级教程,助力深度学习训练!

恒源云

DataPipeline助力国际知名物流服务商,打造供应链改革新样本!

DataPipeline数见科技

web技术分享| 前端秘籍之“易容”术

anyRTC开发者

人工智能 大前端 音视频 web技术分享

AD域是什么意思?有什么用?

行云管家

服务器 内网 AD域

对象存储手把手教五 | 数据存取与加密

QingStor分布式存储

对象存储 分布式存储 数据加密

你的工作谁做主?

产品运营心经

工作效率 职场成长

金九银十涨薪50%,从默默无闻,到坐上美团L8技术专家(面经+心得)

Java 编程 程序员 架构 面试

意外发现GitHub 星标35k+ 435页网络协议深度笔记,出自华为架构师

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

Python中使用定时调度任务(Schedule Jobs)的5种方式

Regan Yue

Python 调度 9月日更

ResNet-50 在 ImageNet-1k 上的实验笔记

毛显新

人工智能 神经网络 深度学习 卷积神经网络 PyTorch

用遗传算法进行智能排课,相信老师会很喜欢

华为云开发者联盟

AI 编码 遗传算法 算子 课程编排

Vite + Vue3 + OpenLayers 弹窗

德育处主任

大前端 地图 vite Vue3 openlayers

阿里内部进阶资料:24w字的Java面试宝典,竟然在GitHub霸榜月余

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

发布半小时登上GitHub首页的Spring Boot实战笔记,竟是京东T8编写

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

Alibaba内部最新Java架构核心宝典 (全彩版小册开源)

Java 程序员 架构 面试 计算机

SQL注入详解

行者AI

测试

如何看待深度学习?_语言 & 开发_谢丽_InfoQ精选文章