AI 前线导读:
华为孟晚舟获保释,保释金 1000 万加元
高通告苹果侵权胜诉,中国市场部分型号苹果手机遭禁售
阿里或参与旷视逾 5 亿美元投资
PyTorch 正式发布 1.0 稳定版
史上最强棋类 AI AlphaZero 登上《科学》
台湾国立清华大学和谷歌研究院创建 InstaNAS,可将两类目标设为搜索目标
谷歌大脑提出评估合成视频质量的标准 FAD
佐治亚理工学院创建无人车系统,教车辆更具“侵略性”
谷歌大脑联合英国高中生等发布 MNIST 的替代数据集 Kuzushiji- MNIST
OpenAI 发布训练环境 CoinRun
更多干货内容请关注微信公众号“AI 前线”(ID:ai-front)
华为孟晚舟获保释,保释金 1000 万加元
当地时间 11 日下午,不列颠哥伦比亚省高等法院的法官宣布,准许孟晚舟获得保释。
法官在声明中表示,逮捕孟女士是基于美国的要求,但是美国方面尚未对孟女士正式提出引渡要求。法官给美国提出的向加拿大提出引渡要求的期限是孟女士被捕之日起的 60 天之内。考虑到孟女士在中国和其他地方都没有刑事犯罪记录,以及目前存在健康问题,加上她本人目前愿意居住在温哥华、有合适的担保人等诸多情况,决定允许她保释。
孟晚舟保释条件包括:1000 万加元保释金(其中 700 万是现金),包括她丈夫在内的 5 位担保人,交出护照,戴电子监控设备,外出时间和地域限制,由专业的团队进行全天候监视等。
今天,孟晚舟发朋友圈表示自己在加拿大已回到家人身边,并感谢大家的关心。
高通告苹果侵权胜诉,中国市场部分型号苹果手机遭禁售
据路透社报道,芯片供应商高通周一表示,已从中国一家法院获得一项命令,禁止在中国销售苹果的几款旧款 iPhone 手机,原因是两项专利侵权。不过苹果表示,其手机仍在销售。
福州市中级人民法院上周发布的这一初步命令,禁售的型号包括 iPhone 6S、iPhone 6S Plus、iPhone 7、iPhone7 Plus、iPhone 8、iPhone 8 Plus 和 iPhone X。
据路透社报道,此案是苹果和高通之间一场全球“专利战”的一部分,其中包括数十起诉讼。2017 年底,高通在中国提起诉讼,称苹果侵犯了与调整照片尺寸和管理触摸屏应用程序相关的功能的专利。高通还要求美国监管机构出于专利方面的考虑禁止几款 iPhone 手机的进口,但遭到美国政府官员的拒绝。
苹果周一表示已向法院申请复议,这是对这一禁令提起上诉的第一步。为了执行这一禁令,高通必须单独向执行法庭提出申诉,苹果也将有机会在那里上诉。
阿里或参与旷视逾 5 亿美元投资
据彭博社援引知情人士消息称,人工智能初创企业旷视科技在与包括阿里巴巴在内的潜在投资者商谈融资事宜,该公司目标是在本月内完成此轮融资,总额超过 5 亿美元。知情人士称,旷视科技旗下人工智能平台 Face++也在与中国私募股权投资者商谈融资。
对此,阿里巴巴回应表示对市场传言不予评论;而旷视科技表示不予置评。
此前报道称,旷视科技已从包括阿里巴巴和博裕资本在内的投资者获得资金。
PyTorch 正式发布 1.0 稳定版
在 NeurIPS 大会上,Facebook 正式发布了 PyTorch 1.0 稳定版。据介绍,此版本具备生产导向的功能,同时还可以获得主流云平台的支持。
现在,研究人员及工程师可以轻松利用这一开源深度学习框架的新功能,包括可在 eager execution 和 graph execution 模式之间无缝转换的混合前端、改进的分布式训练、用于高性能研究的纯 C++ 前端,以及与云平台的深度集成。
PyTorch 1.0 将加速 AI 从原型到生产部署的工作流程,并使这一进程更加容易执行。
史上最强棋类 AI AlphaZero 登上《科学》
近日,经过同行审议,DeepDind 推出的迄今为止最强大棋类 AI AlphaZero 以论文的形式被刊登在《科学》期刊上。
论文表示,DeepDind 团队使用了 5000 个 TPU,让 AlphaZero 快速掌握将棋、国际象棋和围棋。在三款棋类比赛中,AlphaZero 打败三款 AI Stockfish、elmo、AlphaGo Zero。根据游戏的风格和复杂度,网络需要的训练量不同,训练国际象棋需要 9 小时,将棋需要 12 小时,围棋需要 13 天。
这项研究的独特之处在于,研究团队将机器学习算法、与蒙特卡罗树(MCTS)的“搜索方法”结合到了一块。
这是 Go 围棋 AI 决定下一步行动所采用的方式,此次 DeepMind 团队在国际象棋和将棋 AI 上也套用了同样的机制,首次展示了该方法适用于其它复杂的游戏测试。
《科学》刊载论文:
http://science.sciencemag.org/content/362/6419/1140
棋局下载地址:
https://deepmind.com/research/alphago/alphazero-resources/
DeepMind 博客:
https://deepmind.com/blog/alphazero-shedding-new-light-grand-games-chess-shogi-and-go/
台湾国立清华大学和谷歌研究院创建 InstaNAS,可将两类目标设为搜索目标
过去二十多年,人们使用各种 AI 技术如强化学习等设计神经网络架构,并获得了一些成果。最近,我们看到更多推进这种被称为“神经架构搜索”(NAS)系统发展的高效方法,例如ENAS 和SMASH这样的方法展示了以前需要数百个 GPU 才能完成的任务,现在用一个或两个 GPU 就可以。
现在,研究人员开始探索 NAS 的另一个维度:让它们为 NAS 系统提供多个目标的开发技术,可以根据不同的约束指定网络。台湾国立清华大学和谷歌研究院的新研究介绍了 InstaNAS,该系统可让人们将两类目标指定为搜索目标、任务相关目标(例如,给定分类任务的准确性)和架构级目标 (例如,延迟/计算成本)。
工作原理:训练 InstaNAS 系统分为三个阶段:预训一次性模型;引入一个控制器,学习从一次性模型中选择相对于每个输入实例的架构,在此阶段,“交替训练控制器和一次性模型,让一次性模型能够适应控制器的分布变化;最后,系统选择最能满足约束的控制器。之后,用最高性能的控制器重新训练一次性模型。
结果:使用 InstaNAS 训练的系统在 CIFAR-10 和 CIFAR-100 在 MobileNetV2 上的平均延迟降低 48.9%和 40.2%,准确度分数势均力敌。准确度略有下降(例如,InstaNAS 系统的准确度最高约为 95.7%,而 NAS 训练系统的准确度为 96.6%。)
重要性:随着人工智能的工业化,我们将把越来越多的 AI 开发工作交给 AI 系统本身。NAS 方法的开发和扩展对此至关重要。我的直觉是,对于一些非常大规模的 NAS 系统,我们最终可能会创造出一些巨大的能量消耗系统,这些系统将隐含(未被认可的)一些环境外部性。
阅读更多:InstaNAS:实例感知神经架构搜索。
谷歌大脑提出评估合成视频质量的标准 FAD
现在,合成视频大量出现,但我们缺乏评估生成视频质量和技术进步的指标,因此,谷歌大脑的研究员提出了一种被称为 Frechet Video Distance (FVD)的评估方法。
Frechet Video Distance(FVD):FVD 不仅将会为视频质量打分,还会为时间相干性,也就是事物从帧到帧的过渡方式打分。FVD 基于“Inflated 3D Convnet”建立,它包含对应于随时间变化的动作序列的有用特征关系。FVD 利用 Inflated 3D Convnet,在人类为主体的 YouTube 视频 Kinetics 数据集上进行训练,让 FVD 表征合成视频中时间转换之间的差异,以及来自现实世界的物理运动的自身特征表示之间的差异。
研究人员引入了一个基于星际争霸 2 的新数据集,这个数据集包括各种场景,每种情景包含 14000 个视频。
结果:FVD 似乎是一种衡量人类在对合成视频进行定性评估时所得分数的指标。“很明显,FVD 可以更好地根据人类对视频质量的看法对模型进行排名”。
重要性:合成视频可能会在人工智能政策中引发大量巨大的挑战,因为该研究领域的进展会立即应用到创建自动化的过程中。而这个领域最具挑战性的事情之一,就是目前仍缺乏可用于跟踪这些进展的指标,从而估计合成视频何时可能变得“足够优质”。“我们相信 FVD 和 SCV 将极大地促进视频生成模型的研究,提供一个定制、客观的进展衡量标准。”
阅读更多:迈向准确的视频生成模型:新的度量和挑战。
数据集:https://storage.googleapis.com/scv_dataset/README.html
佐治亚理工学院创建无人车系统,教车辆更具“侵略性”
佐治亚理工学院的研究人员创造了一种自动驾驶汽车系统,在泥土轨道上成功完成 1:5 比例“AutoRally”车辆的高速导航。此工作为无人车向越野车发展,并为军队开发自己的无人驾驶地面车辆(UGV)提供指导。
工作原理:融合深度学习和模型预测控制:为了创建该系统,研究人员将单眼摄像机的视觉输入提供给静态监督分类器或循环 LSTM,使用该信息来预测车辆在预先下载的地图示意图中的位置。然后,他们将此预测提供给基于 GPU 的粒子滤波器,该滤波器结合来自车辆 IMU 和车轮速度的数据,进一步预测车辆在地图上的位置。
研究人员在 Georgia Tech Autonomous Racing Facility 的复杂泥土路上测试了他们的系统。这个轨道路况复杂,“包括各种半径的转弯,180 度发夹弯道和 S 形弯道,以及长直线路线”。结果表明,AutoRally 汽车能够多次击败经验丰富的人类测试驾驶员。
重要性:此论文展示了混合系统——深度学习作为单个特定组件发挥作用,可能会在具有挑战性的领域中得到很好的应用。预计,未来大多数应用机器人系统能够使用模块化系统,并结合最好的人工指定系统和基于深度学习的功能近似系统。
阅读更多:基于视觉的高速驾驶与深度动态观察器。
谷歌大脑联合英国高中生等发布 MNIST 的替代数据集 Kuzushiji- MNIST
二十多年来,AI 研究人员都是通过 MNIST 的性能表现来评估各种有监督和无监督学习 AI 技术,MNIST 是一个由大量高度像素化的黑白手写数字组成的数据集。
现在,人文学科开放数据中心、蒙特利尔学习算法研究所、国家日本文学研究所、谷歌大脑和英格兰的一位高中生(Kaggle 竞赛获胜者)发布了“Kuzushiji- MNIST——一个专注于 Kuzushiji(草书日语)的数据集,以及两个更大,更具挑战性的数据集 Kuzushiji-49 和 Kuzushiji-Kanji“。
数据:Kuzushiji 数据集由 300000 多本日本书籍组成,从中抄录一些文字并添加边界框。完整数据集包含 403942 个字符的 3999 种字符类型。“我们对在 18 世纪印刷的 35 本经典书籍扫描的字符进行了预处理,并将数据集分为 3 个部分:(1)Kuzushiji-MNIST,一个 MNIST [16]替代品的数据集,(2)Kuzushiji-49,一个包含 48 个平假名字符和一个平假名迭代标记的数据集,它更大但数据不均衡,以及(3)Kuzushiji-Kanji,3832 个汉字字符的不均衡数据集,包括罕见字符的少量样本。“
测试结果:这些数据集对于 AI 研究人员来说比 MNIST 本身更具挑战性,许多在 MNIST 上达到 99%以上分类准确度的技术在 Kuzushiji-MNIST 的准确度下降到 95%到 98 之间,而 Kuzushiji-49 的得分仅有 97%。
重要性:此类工作表明,人们可以更专注地思考人工智能的基础数据源,开发出新的方法,让研究人员能够更好地进行人工智能研究,同时扩大人工智能系统和方法易于获取的文化艺术品的范围。
阅读更多:深度学习用于日本古典文学(https://arxiv.org/abs/1812.01718)。
OpenAI 发布训练环境 CoinRun
近日,OpenAI 发布了一个新的训练环境 CoinRun,为评估 agent 将经验迁移到新的场景中的能力提供了指标。
阅读更多:量化强化学习中的泛化。
CoinRun 代码:https://github.com/openai/coinrun
作者 Jack Clark 有话对 AI 前线读者说:我们对中国的无人机研究非常感兴趣,如果你想要在我们的周报里看到更多有趣的内容,请发送邮件至:jack@jack-clark.net。
参考链接:
评论 1 条评论