导读
两会总理报告首提“智能+”,众大佬建言
OpenAI 发布大型强化深度学习模拟器 Neural MMO
Google Coral:谷歌机器学习 Edge TPU 定制产品终于要来了
MIT 发布全球首个四足后空翻迷你猎豹机器人
Mozilla 开放现有最大人类语音数据集
吴恩达创业公司 Drive.ai 被曝正在寻求出售
谷歌使用机器学习提高风能发电效率
斯坦福发布视觉问答新基准测试集 GCA,准确度大幅提升
让大计算彻底对所有研究者来说唾手可得
为斯坦福和 MIT 的 250,000 张胸部 X 光片数据集打标签
两会总理报告首提“智能+”,众大佬建言
2019 年两会时间到来,3 月 5 日,人工智能连续第三年被写入总理报告中,并且首次提出“智能+“。
今年,总理在报告的推动传统产业改造提升部分指出智能+,打造工业互联网平台,拓展“智能+”,为制造业转型升级赋能。
报告原文部分:
打造工业互联网平台,拓展“智能+”,为制造业转型升级赋能。支持企业加快技术改造和设备更新,将固定资产加速折旧优惠政策扩大至全部制造业领域。强化质量基础支撑,推动标准与国际先进水平对接,提升产品和服务品质,让更多国内外用户选择中国制造、中国服务。
此外,在会上,百度、腾讯、科大讯飞、小米等企业均给出了新的建议,涵盖人工智能、5G、航空航天、网络安全等各行各业。
李彦宏:建议推进智能交通与医疗,制定 AI 伦理研究,提议构建智能交通解决方案;提高电子病历的互联互通性,形成优质高效的医疗卫生服务体系;建议由政府主管部门牵头,开展人工智能伦理的研究和顶层设计。
雷军:我国应该提前布局 5G 产业应用,推动 5G 与物联网的创新融合发展;加快推动航天立法,确保民营企业长期稳定、合理有效利用空间资源的权利。
丁磊:更加关注“AI+教育”以及利用 AI 促进精准扶贫的发展,并利用大数据分析和专家顾问力量,从地区产业发展规划、供应链源头、商品打造等上游入手,进行精准扶贫。
马化腾:提出了七项建议,包括加快互联网产业发展、保护未成年上网安全等,如大力推进信息基础设施建设,加快 5G 和 IPv6 全面商用部署;促进云计算创新发展,加速实体经济数字化转型;由国家牵头,建立“一站式”的未成年人网络使用管理平台。
刘庆峰:科大讯飞机器人在两会期间以中央广播电视总台的记者助理的身份出现,刘庆峰的建议包括类脑计算+深度学习的跨界融合;AI 全科医生辅助诊疗,上山下乡;AI 教育体系的建设;数据安全立法等等。
董明珠:董明珠表示,格力手机肯定会跟上 5G 手机和柔性屏的大趋势,紧跟科技发展趋势,“制造业不是靠资本来实现突破的,而是要靠自身的创新、技术来实现。企业在做好内生性发展的同时,通过并购等方式实现外延式发展,更能促进企业的快速发展。”此外,她还谈到建议个税起征点“最好能够提升到 1 万”,主张“有钱人多纳税”。
OpenAI 发布大型强化深度学习模拟器 Neural MMO
3 月 5 日,OpenAI 发布了一款”大型多角色”虚拟训练场景游戏,把 AI 代理放进一个类似于 RPG(角色扮演游戏)的模拟场景中,AI 们会互相竞争,通过战争来抢夺有限的资源,从而得到优化。
和其他系统相比,Neural MMO 具有持久性,代理无需环境重置,可在其他学习代理存在的情况下同时学习;规模大,环境支持大量可变数量的代理,实验考虑到了 100 个并发服务器中每个服务器中多达 128 个并发代理长达 100M 的生命周期;效率高,包含可以比较代理性能表现的 baseline(在 100 多个世界中训练),且计算开销相对较低,训练只需要一个桌面 CPU;扩展强,Neural MMO 目前的核心功能包括基于地图的地形程序生成,食物和水觅食系统以及战略战斗系统。未来可能会进行开源驱动的扩展。
OpenAI 使用神经 MMO 来训练 AI 系统,通过奖励代理生命周期来进化,也就是说,AI 会让自己活的尽量长久,代理之间彼此交互的时间越长,就可以更好地完成某些任务,而且增加并发代理的最大数量可以更好地进行探索。有趣的是,他们还发现增加代理的规模会促使它们进入地图的不同部分,而在较广阔的环境中训练的代理“始终”胜过只在较小环境中经过训练的 AI。
Google Coral:谷歌的机器学习 Edge TPU 定制产品终于要来了
在去年于旧金山召开的 Google Next 大会上,Injong Rhee 通过主题演讲披露了谷歌公司的两款全新硬件产品:一款开发单片,外加一款 USB 加速棒。作为这两款产品的核心,谷歌的 Edge TPU 扮演着关键角色——这款专用 ASIC 旨在将机器学习推理能力引入边缘设备。
在近一年之后,两款产品以“Coral”的名号推出了“Beta 测试版”,且目前已经可供感兴趣的朋友购买。另外,这两款新硬件还将在本周晚些时候通过 TensorFlow Dev 峰会正式亮相。
Edge TPU 是由谷歌公司设计并制造的小型 ASIC,能够以低功耗水平提高出色的 ML 推理性能。例如,其能够以良好的功率表现执行 MobileNet v2 等最先进的移动视觉模型,且 fps 可达 100 以上。这意味着你将能够在符合节能与隐私保护要求的前提下,将快速 ML 推理能力引入自己的嵌入式 AI 设备。
Coral USB 加速棒是一款插入式 USB 记忆棒,能够为现有 Linux 系统提供强大的 ML 推理功能。通过 USB 3.0 接口连接 Edge TPU,设备即可快速对本地 AI 应用程序进行原型设计。
MIT 发布全球首个四足后空翻迷你猎豹机器人
近日,MIT 发布了自研最新“迷你猎豹机器人”(Mini Cheetah robot)。这是全球首个可以做后空翻的四足机器人,重 20 磅。
在视频展示中,这个机器人可以做后空翻、奔跑、侧身跑、横着走、倒着走、跳跃等动作,就像一只灵活的小狗。
MIT 研发猎豹机器人不依靠视觉和任何外部传感器,凭借控制算法可以飞跃上桌,能轻松爬上满是障碍物的楼梯,甚至在突然被猛推或猛踢时迅速恢复平衡。
Mozilla 开放现有最大人类语音数据集,包含 18 种语言, 1400 小时语音数据
2 月 28 日,Mozilla 发布了最大的人类语音数据集,包括 18 种不同的语言(英语、法语、德语和汉语普通话、威尔士语和卡比尔语等) ),总计记录了超过 42000 个贡献者的近 1400 个小时的语音数据。
随着此版本的发布,这个仍然在不断增长的通用语音数据集现在已经是同类数据集中最大的。
接下来,完整的数据集将在 Common Voice 站点上提供下载。
官方中文下载地址:https://voice.mozilla.org/zh-CN/datasets
GitHub 地址:https://github.com/JRMeyer/open-speech-corpora
吴恩达创业公司 Drive.ai 被曝正在寻求出售
据外媒 The Information 报道,无人驾驶明星初创公司 Drive.ai 将以 2 亿美元价格出售,并聘请了投行人士担任顾问。
Drive.ai 由 AI 大牛吴恩达和其学生创立,创始之初便备受关注,吴恩达本人担任董事职务,并参与该公司日常经营。
目前,Drive.ai 已经在得克萨斯州落地并展开类似“公交”的载客服务,可以在特定路线接人送客,甚至还以这套方案服务获得了当地政府的报酬,上一次融资时估值 2 亿美元。
谷歌使用机器学习提高风能发电效率
DeepMind 使用基于神经网络的系统,通过更好地预测系统可能产生的功率来提高谷歌风力发电机组(700 兆瓦的容量)的效率。DeepMind 的系统经过训练,可以在实际发电前 36 小时左右预测风电功率,并且已经取得了一些成功。“这很重要,因为可以按照计划生产能源(即可以在规定的时间内提供一定量的电力)通常对电网更有价值,“该公司表示。
数字:20%。这是系统改善系统(有点模糊定义)“价值”的数字,“与没有时间计划的电网情景相比”。
重要性:人工智能将帮助我们为全球创造一种感知和响应基础设施,我们可以预想在全球各种公用事业基础设施中采用各种基于机器学习的方法,以提高地球电力基础设施的效率。
阅读更多:机器学习可以提升风能的价值( https://deepmind.com/blog/machine-learning-can-boost-value-wind-energy/ )。
斯坦福发布视觉问答新基准测试集 GCA,准确度大幅提升
斯坦福大学发布了测试数据集 GQA 的详细信息,这是一个“用于实际视觉推理和成分问答的数据集”,旨在克服其他视觉问答(VQA)数据集的缺点。
GQA 数据点:GQA 包含 113k 图像和 2200 万种各种类型和组合的问题。这些问题旨在“衡量一系列推理技巧,如对象和属性识别、传递关系跟踪、空间推理、逻辑推理和比较”。这些问题是通过“问题引擎”在算法上创建的(虽然比一定有名称所示的那么有趣,但如果你喜欢阅读自动数据创建管道相关的东西,还是值得一读的)。
GQA 示例问题:GQA 产生的一些问题包括:‘餐巾和杯子的颜色是否相同?’; “熊是什么颜色的?”; “图像的哪一侧是盘子?”; “有时钟或镜子吗?”等。虽然这些问题缺乏人文问题的多样性,但确实具有数量多且易于生成的良好特性。
GQA 的难点:新的 AI 测试制度的失败原因之一是它们过于简单了。这可能会导致数据发布后立即解答数据集问题。(以 SQuAD 为例,这个问答数据集在约一年时间内就被算法掌握,因此催生了 SQuAD 2.0 这个更难的数据集。)为了避免这种情况,GQA 背后的研究人员测试了大量模型,并确保数据集足够难。
基准测试结果(准确度):
'Blind’LSTM:在没有看到任何图像的情况下准确度 41.07%。
Deaf CNN**:没有看到任何问题的情况下获得 17.82%的准确度。
CNN + LSTM:46.55%。
自下而上注意力模型(2017 年视觉问答挑战赛的获胜者):49.74%。
MAC(关于 CLEVR 的最新技术,一个范围相似的数据集):54.06%。
人类:89.3%。
重要性:数据集和挑战有推动人工智能研究进展的历史,GQA 为测试系统提供了更具挑战性的基准。同时,开发能够通过图像分析和对图像的文本查询的响应来理解周围世界的系统,是具有重要经济应用潜力的 AI 研究的主要目标。
阅读更多:GQA:一个新的数据集,用于回答现实世界中的图像( https://arxiv.org/abs/1902.09506 )。
让大计算彻底对所有研究者来说唾手可得
斯坦福大学、苏黎世大学、加州大学伯克利分校和伊利诺伊大学厄本那香槟分校的研究人员汇总了 2017 年在斯坦福大学举办的系列讲座,作为学术研究者使用大规模云计算的宣言。这是为了回应两种主流趋势:
在一些科学领域(例如,机器学习),通过采用越来越大规模的计算系统已经有了很多发现。
由于缺乏资源和难度较大,许多学术研究人员无法进行大规模的计算实验。
为什么计算很重要:作者预测“广泛的大规模计算实验的出现是科学进步的基本途径,作为传统的归纳途径(在观察科学中)和演绎(在数学科学中)的补充”。他们指出,“目前人们对机器学习的热情(及其深度学习的多样性),似乎证明了大规模的计算实验已经开始得到回报,时机已来”,例如谷歌和微软从统计机器翻译转向神经机器翻译,计算机视觉研究人员转向使用基于深度学习的系统,以及特斯拉等自动驾驶公司越来越多地应用神经网络等。
重要性:人工智能与生俱来的一个问题是“大计算”和“小型计算”玩家的出现,其中少数实验室(例如,FAIR、DeepMind、OpenAI、Google Brain)能够访问大量数据计算资源,而大多数人工智能研究人员则致力于自建 GPU 桌面或访问(越来越无关紧要)大学的超级计算集群。能够弄清楚如何让每个研究人员都可以轻松使用大量计算,进行大规模试验对于加速科学进步来说至关重要。
阅读更多:雄心勃勃的数据科学不再苦不堪言( https://arxiv.org/abs/1901.08705 )。
为斯坦福和 MIT 的 250,000 张胸部 X 光片数据集打标签
医生兼人工智能评论员 Luke Oakden-Rayner 分析了斯坦福大学发布的一个名为 CheXpert 的新医学数据集。该数据集由来自 62,240 名患者的 244,316 张胸部 X 光片组成,可用作数据集帮助开发能够更好地自动分析图像的算法。
数据、数据、数据:Luke Oakden-Rayner 明确指出的这件事的价值是数据集标签,强调了医生会按照自己习惯“发明”各种各样的手写笔记,这对于非专业读者来说非常困难,而且将手写笔记数字化并不容易,例如,许多包含病理图像的胸部 X 射线可能被标记为“没有发现”,因为它们是从同一患者拍摄的 X 射线序列的一部分。同样地,许多标签并不没有准确描述图像。
重要性:该数据集解决了先前版本的数据集 CXR14 的很多局限性问题,包括“开发更具临床意义的标签方案,以原始分辨率提供图像,并使用专家视觉分析生成测试集”,他写道。“但是,我们需要在发布前更全面地记录和讨论这些数据集。数据仍然存在缺陷,这无疑会对模型性能产生影响。除非这些问题得到解决,很多用户甚至都不会发现这个数据集,这是我们作为一个社区需要做得更好的地方。“
阅读更多:50 万张 X 光片!斯坦福和麻省理工学院胸部 X 光片数据集之初印象( https://lukeoakdenrayner.wordpress.com/2019/02/25/half-a-million-x-rays-first-impressions-of-the-stanford-and-mit-chest-x-ray-datasets/ )。
作者 Jack Clark 有话对 AI 前线读者说:我们对中国的无人机研究非常感兴趣,如果你想要在我们的周报里看到更多有趣的内容,请发送邮件至:jack@jack-clark.net。
参考链接:
评论