写点什么

对话机器学习大神 Michael Jordan:简介

  • 2014-09-21
  • 本文字数:1852 字

    阅读完需:约 6 分钟

Michael I. Jordan 是加州大学伯克利分校电子工程系、计算机科学和统计系的陈丕宏杰出教授。他在亚利桑那州立大学获得了数学硕士学位,并且在 1985 年从加利福尼亚大学圣地亚哥分校获得了认知学博士学位。自 1988 年到 1998 年,乔丹在麻省理工学院任教授,他的研究方向包括了计算学、统计学、认知科学以及生物科学,最近几年集中在贝叶斯非参数分析,概率图模型,谱方法,核方法和在分布式计算系统、自然语言处理、信号处理和统计遗传学等问题的应用上。

乔丹教授是美国国家工程学院院士、科学院院士和美国艺术和科学学院院士。同时,他还是美国科学进步协会的资深会员。他被数理统计研究所任命为奈曼讲师和奖章讲师。在 2015 年,他获得了 David E. Rumelhart 奖;在 2009 年,他获得了 ACM/AAAI 的 Allen Newell 奖。同时,他是 AAAI、ACM、ASA、CSS、IEEE、IMS、ISBA 和 SIAM 的成员。

带着在机器学习方面的诸多的贡献,于 9 月 10 日,Michael I. Jordan 教授在著名社区 Reddit 的机器学习板块参加了“Ask Me AnyThing”活动,乔丹教授回答了机器学习爱好者许多问题。本系列整理了相关的问答,供远在地球另一面的国内人工智能和机器学习爱好者学习讨论,所有问答的先后顺序由 Reddit 用户投票决定。

乔丹教授在机器学习领域里一个重要的贡献就是关于参数化模型和非参数模型的研究,他认为非参数模型还没有开始发展。在问及这个话题时,他指出主要是相关领域学者根本没有尝试过。他以 LDA 模型为例详细讲述了这两种模型。注意到 LDA(隐含狄利克雷分布)是一个带参数的贝叶斯模型,其中包括 K 个假设已知的主题。而非参数版本的 LDA 被称为 HDP(隐含狄利克雷过程)。从实际实现上来看,从 LDA 到 HDP 仅仅是一小步。从 LDA 提出至今,LDA 已经被用于数千种应用了。然而,使用 LDA 模型并不比使用 HDP 模型具有更多的优势,有时候甚至恰恰相反。

乔丹教授认为,贝叶斯非参数模型领域的推广真正需要的是一个简单的介绍——写出它的数学模型,并且展示它的美丽——目前这样的介绍并不存在。所以,他和他的同事 Yee Whye The 正在从事这项工作,并基本上写完了这样的介绍,有很大可能在今年秋天发行出来。

乔丹教授非常看好非参数模型,他说到“贝叶斯非参数模型刚刚在机器学习领域里点亮了未来,将如同经典的非参数模型有着广阔的舞台和发展前景”。这些模型能够在复杂性上持续增长,就像在信息时代数据积累看上去那么自然。如果这些模型能够得到很好的控制,并且聚焦在在带参数的子模型,非参数模型将会越来越流行。

机器学习领域非常博大精深,很多人可能是刚刚入门,好的学习资料对于机器学习初学者来说非常有用。乔丹教授在黑客新闻里,列出了机器学习的一系列阅读书籍,以方便读者开始学习机器学习,详细清单见 https://news.ycombinator.com/item?id=1055042

乔丹教授的这份列表是为了那些进入伯克利分校的博士研究生而写的,这些人都是会将他们生命未来的几十年投身于这个领域,并且想要迅速的得到这个领域的前沿知识。乔丹教授说到,针对那些在工业界中需要足够的基础知识以使能够在几个月内开始工作的人,他准备一分完全不同的列表。

在问及这套书籍是否过时时,乔丹教授表示这套书籍列表来自几年前。他现在倾向于添加一些进一步挖掘基础主题的书。他特别推荐 A. Tsybakov 的书《Introduction to Nonparametric Estimation》作为获得估计下界工具的很可读的书籍,还有 Y. Nesterov 的《Introductory Lectures on Convex Optimization》来理解优化过程中的下界。同时,他推荐 A. van der Vaart 的《Asymptotic Statistics》,这本书是伯克利分校的教材,书中包含了推断过程中的很多寄托于经验过程理论之上想法。比如 M 估计,包含了最大似然法和经验风险最小化等等。还有 B. Efron 的《Large-Scale Inference: Empirical Bayes Methods for Estimation, Testing, and Prediction》,这也是一本很发人深省的书。

在乔丹教授的想法中,他不期望着所有来伯克利的学生都已经把所有这些书读过,但是他希望他们已经做了一些选择,并且花了一些时间至少读过大部分书中的一些章节。而且,他认为这些将要进入机器学习领域的学生不仅需要最终读完这些书籍,更需要将它们都读上至少三遍——第一遍能够勉强明白了,第二遍去尝试做相关实验推导,第三遍看到之后会觉得这些都是显而易见的。


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-09-21 08:356216
用户头像

发布了 268 篇内容, 共 121.7 次阅读, 收获喜欢 24 次。

关注

评论

发布
暂无评论
发现更多内容

入门指南:使用Spring Boot构建Java应用程序

2756

入门学习

NFTScan 与 Sender Wallet 达成合作伙伴,双方在多链 NFT 数据方面展开合作!

NFT Research

NFT\

据平台流量回放最佳实践|精选

得物技术

前端 后端

华为开发者大会—开发者的一站式代码检查利器:华为云代码检查CodeArts Check

华为云PaaS服务小智

云计算 华为云 华为开发者大会2023

一图看懂华为云CodeArts Board5大特性,带你玩转看板服务

华为云PaaS服务小智

云计算 数据可视化 华为云 企业研发管理 数据看板

工业物联网SCADA软件推荐

2D3D前端可视化开发

工业物联网 工业控制系统 web组态软件 HMI SCADA软件

架构实战营(一)

架构实战营

AI与企业信息安全的应用、技术以及前景

行云管家

AI 网络安全 信息安全 企业信息

最佳实践|亚马逊可持续发展的架构模型

亚马逊云科技 (Amazon Web Services)

JavaScript

实现 AI 大语言模型的关键在于超高性能存储能力

焱融科技

[Qt开发]一口气搞懂串口通信

EquatorCoco

通信 qt

Maven进阶学习指南 | 京东云技术团队

京东科技开发者

maven 组件 依赖 Maven仓库 企业号 6 月 PK 榜

李彦宏:AI原生应用比大模型数量更重要

飞桨PaddlePaddle

人工智能 百度 paddle 大模型

直播程序源码技术分享主播邀请上麦功能

山东布谷科技

软件开发 程序 源码搭建 直播源码

目前包头市等保测评企业有几家?2家还是3家?

行云管家

等保 等级保护 等保测评 等保合规

什么是区块链?

TiAmo

区块链 去中心化 6 月 优质更文活动

3dMax 应该用哪个渲染器?Vray、Corona、Arnold?

Finovy Cloud

沐曦与百度飞桨完成兼容性测试,助力计算机视觉应用发展

飞桨PaddlePaddle

人工智能 百度 paddle

码控算法

qh12346

New Arrival: QCN9074 Dual Band/Tri-band 4X4 WIFI6 Network Card DR9074 (#QCN9074)

wallyslilly

QCN9074

CVPR2023|小红书提出 OvarNet 模型:开集预测的新SOTA,“万物识别”有了新玩法

小红书技术REDtech

深度学习 算法 小红书

浅析 Jetty 中的线程优化思路

vivo互联网技术

jetty EatWhatYouKill 线程策略

IoT场景时序数据库性能对比报告出炉,TDengine 远超 InfluxDB & Timescal

电子信息发烧客

复旦发布云上最大科研智算平台

新云力量

智能 计算 复旦 科研智算平台

STC89C52+DHT20设计的环境温湿度检测仪

DS小龙哥

6 月 优质更文活动

Go语言中的init函数: 特点、用途和注意事项

EquatorCoco

编程 Go 语言

Flutter性能优化的一些路径思考

Onegun

flutter 移动开发

搜索语义模型的大规模量化实践

百度Geek说

paddle NLP 大模型 企业号 6 月 PK 榜 6 月 优质更文活动 INT8

提升测试质量的四个关键特征

老张

质量保障 测试质量

.NET的基元类型包括哪些?Unmanaged和Blittable类型又是什么?一文带你深度解析

不在线第一只蜗牛

.net 编程

强化学习从基础到进阶-常见问题和面试必知必答[6]:演员-评论员算法(advantage actor-critic,A2C),异步A2C、与生成对抗网络的联系等详解

汀丶人工智能

人工智能 深度学习 强化学习 6 月 优质更文活动

对话机器学习大神Michael Jordan:简介_语言 & 开发_张天雷_InfoQ精选文章