AlphaStar星际争霸10:1绝杀人类；苹果自动驾驶大裁员

华为发布5G芯片天罡和巴龙5000
创新奇智完成超4亿人民币A轮和A+轮融资
苹果裁撤自动驾驶项目员工 200 余人
特斯拉揭秘“克隆行为”技术细节
亚马逊推出机器人Scout，进入运送机器人业务
阿利坎特大学发布环境数据集Robotrix
AlphaStar《星际争霸》以10:1击败人类专业选手
用触摸传感器、图形网络和阴影手图片创建功能更强大的机器人
Vivo 用分层强化学习玩《王者荣耀》
IBM 公布自动神经架构搜索的软件工具 NeuNets 细节
谷歌开放问答搜索最大语料库 NQ，包含 30 万自然提问

华为发布 5G 芯片天罡和巴龙 5000

1 月 24 日，华为在北京发布会上宣布两款 5G 芯片：天罡和巴龙 5000（Balong 5000）。

天罡是业界首款 5G 基站核心芯片，在集成度、算力、频谱带宽等方面取得了突破性进展，包括极高集成，首次在极低的天面尺寸规格下, 支持大规模集成有源 PA（功放）和无源阵子；极强算力，实现 2.5 倍运算能力的提升，搭载最新的算法及 Beamforming（波束赋形），单芯片可控制高达业界最高 64 路通道；极宽频谱，支持 200M 运营商频谱带宽。

此外，华为几个月前已经披露过的 Balong 5000 是世界最快的 5G 多模终端芯片。天罡也为 AAU 带来了革命性的提升，实现基站尺寸缩小超 50%，重量减轻 23%，功耗节省达 21%，安装时间比标准的 4G 基站，节省一半时间，有效解决站点获取难、成本高等挑战。

创新奇智完成超 4 亿人民币 A 轮和 A+轮融资

1 月 24 日，AI+B2B 公司创新奇智宣布完成总金额超过 4 亿人民币的 A 轮和 A+轮融资，本轮融资由中金甲子领投，原股东创新工场、成为资本跟投，华兴 Alpha 担任本轮融资独家财务顾问。

创新奇智表示，本轮融资将用于三方面：

技术团队扩大和行业人才招聘；
市场渠道扩张，目前创新奇智看到了250%的商业提升和442个新的机会，将选择有市场、有行业转型的区域进行投入，将融资用于12个区域市场子公司的建设以及市场渠道建设；
花重金打造战略纵深、提升壁垒，在零售和智能制造等方面打造护城河。

2018 年 3 月，创新奇智成立，去年 5 月曾获得超 1 亿元人民币的天使轮融资。成立 10 个月期间，创新奇智已完成 5 亿元融资。

苹果裁撤自动驾驶项目员工 200 余人

CNBC 报道，苹果本周解雇了旗下自动驾驶汽车集团 Project Titan 的 200 多名员工。以下为苹果发言人回应：

“在苹果，我们拥有一个非常有才华的团队，他们致力于自主系统和相关技术。2019 年，他们将把工作重点放在几个关键领域，一些团队成员将被转移到公司其他部门的项目，在那里，他们将支持整个苹果的机器学习和其他项目。但是，我们仍然相信，自主系统存在巨大的机遇，苹果有独特的能力做出贡献，这是有史以来最雄心勃勃的机器学习项目。”

苹果的无人车项目始于 2014 年，2018 年 8 月，苹果聘请了特斯拉工程副总裁、苹果资深人士 Doug Field 与 Bob Mansfield 共同领导 Titan 团队，在二人领导下，苹果转而研发可以完美适配 iOS 设备的无人车系统，而不是制造实体无人车。

从内部看，本周的裁员行为，被认为是在相对新的领导层管理下进行的预期中的重组，其他受重组影响的员工目前仍留在苹果，但已转移到公司的不同部门。

特斯拉揭秘“克隆行为”技术细节

近日，特斯拉公开了自动驾驶训练“克隆行为”的技术细节。特斯拉汽车收集了大量的来自摄像头和其他传感器的数据，即使 Autopilot 系统没有开启，开发团队也可以研究传统的人类在各种场景中的驾驶动作并加以模仿。

这种技术被称为“行为克隆”，特斯拉的一些工程师称之为“软件 2.0”。实际上，这是一种模仿学习（imitation learning），系统使用模仿的信息作为车辆在特定情况下决定驾驶方式，比如，行驶弯道或避开前方目标等。

但特斯拉不同的地方在于，“行为克隆”让 Autopilot 开发团队也可以研究传统的人类驾驶在各种场景中的动作，加以模仿，不需要任何其他数据和操作就能教会系统如何自主驾驶。在未来，人们可能不需要编写代码来告诉汽车如何应对各种状况。

亚马逊推出机器人 Scout，进入运送机器人业务

亚马逊公开了机器人 Scout，这个 6 轮、高度齐膝的运送机器人负责将货物运送到亚马逊的顾客手中。本周，亚马逊将派出包括 Scout 在内的 6 台机器人在华盛顿斯诺霍米什县作业。“这些机器人将沿着规划路线前行，目前会有一名亚马逊员工跟随，”亚马逊表示。机器人只在白天工作。

重要性：近年来，关于运送机器人的探索有很多，但是真正落地并被人接受的机器人项目屈指可数，亚马逊是第一批公开实验运送机器人落地的大公司之一，以后会出现更多企业进行试验。

阅读更多：遇见 Scout（https://blog.aboutamazon.com/transportation/meet-scout）

阿利坎特大学发布环境数据集 Robotrix

西班牙阿利坎特大学发布了数据集 Robotrix，该数据集包含少量环境的大量信息（16 种不同模拟房间布局，而其他方法如 House3D 则需要数千到数万种）。

该数据集包括在 16 种模拟房间进行的 512 个动作序列组成，通过虚拟引擎高清渲染。这些序列由机器人角色生成，机器人用手与所讨论的对象和物品进行交互。研究人员称这是一个丰富的数据集，模拟房间中的每个物体都有 2D 和 3D 边界框、语义掩模和深度信息。模拟以 1920 X 1080 的分辨率输出 RGB 和深度数据。未来，研究人员希望通过使用虚拟引擎 4 系统的内置物理实体实现“与具有弹性的身体、流体或机器人衣服交互，”进一步提高模拟房间的复杂性。

重要性：像 RobotriX 这样的数据集将使研究人员更容易尝试从获取高分辨率数据中获益的 AI 技术。监测该数据集的采用（或缺乏采用）将有助于我们更好地了解 AI 研究是否需要更高分辨率的数据，或者大量低分辨率数据是否足够。

阅读更多：RobotriX：具有机器人序列轨迹和交互的真实超大规模室内数据集（https://arxiv.org/abs/1901.06514）。

数据集（Github：https://github.com/3dperceptionlab/therobotrix）。

AlphaStar《星际争霸》10:1 击败人类专业选手

近日，DeepMind 公布了 AlphaStar 系统，并在实时战略游戏《星际争霸 II》中击败了人类专业选手，证明该系统在比赛中战胜人类。

AlphaStar 系统结合了基于人群的训练、模仿学习和强化学习。据 DeepMind 称，该系统“将变压器躯干应用于单元，并结合深度 LSTM core，带指针网络的自动回归策略和中心化值 benchmark”。

探索： 有趣的是，AlphaStar 将基于人群的训练与模仿学习结合起来，从人类比赛重放中引导系统（星际争霸等游戏中具挑战性的探索之一）之后，在 DeepMind 设计的联盟中让代理互相竞争，从而培养出越来越强大的代理，形成该系统的环境。

争议：Aleksi Pietikainen 已经写了一些关于 DeepMind 如何选择呈现 AlphaStar 结果的想法，以及系统在游戏中采取突发性快速行动的能力意味着它可能已经超越了人类，但不一定表明系统是聪明的，只是在选择单位的动作时能够超越人的精确度和速度。这凸显了评估 AI 系统性能的难度，并引发了一个哲学问题，即 DeepMind 是否可以限制或约束 AlphaStar 采取行动的数量和频率，足以让它学会更有战略性地战胜人类。

阅读更多：分析 DeepMind 在《星际争霸 2》中超越人类的速度可能只是模仿学习局限性的弥补 https://blog.usejournal.com/an-analysis-on-how-deepminds-starcraft-2-ai-s-superhuman-speed-could-be-a-band-aid-fix-for-the-1702fb8344d6

用触摸传感器、图形网络和阴影手图片创建功能更强大的机器人

来自西班牙的研究人员使用 Shadow Dexterous 手，配备 BioTac SP 触觉传感器来训练 AI 系统，预测其可以应用于各种物体的稳定抓取。

工作原理：系统从传感器数据接收输入，将其转换为研究人员称之为“触觉图”的图形表示，然后将此数据输入图形卷积网络（GCN），该网络学习映射传感器数据的不同组合预测当前的抓握是否稳定。

数据集：他们使用 BioTacSP 数据集，这是一组通过操纵 41 种不同形状和纹理的物体收集的抓取样本，包括水果、可爱的玩具、罐子、盒子里的牙膏等。他们还为这个数据集添加了 10 个新对象，包括来自热门游戏《我的世界》的怪物、杯子、洗发水瓶等。研究人员记录了手掌以平坦，45 度角，侧面如何操纵这些物体。

结果：研究人员训练了一组具有不同网络深度和宽度的 baseline 模型，并确定了具有 5 层和 32 个特征的架构上的“最佳点”，然后将其用于其他实验。他们在数据集中的所有数据（不包括测试集）上训练表现最佳的网络，并在网络上测试性能，结果报告显示所有手掌方向的精准度达 75％。他们写道：“在处理完全未知的物体时，准确度会大幅下降。”

重要性：收集足够多的数据和/或进行高保真模拟，以收集和生成训练计算机使用触觉所需的数据需要很长时间。这样的论文指导了我们如何使用这些技术。也许在很远的未来，基于这项研究，我们将能够在商店看到机器人手工缝制的可爱玩具，或者看到一家机器人按摩院。

阅读更多：TactileGCN：用于通过触觉传感器预测抓握稳定性的图形卷积网络（https://arxiv.org/abs/1901.06181）。

Vivo 用分层强化学习玩《王者荣耀》

中国智能手机厂商 Vivo 的 AI Lab 展示了如何使用分层强化学习训练 AI 系统玩 1 V 1 多角色游戏《王者荣耀》。《王者荣耀》与《魔兽争霸》和《英雄联盟》玩法相似，都是最多五人的小队争夺一张地图的控制权，同时尝试摧毁对方的防御工事，并最终摧毁对方的家园基地。

工作原理：研究人员将强化学习和模仿学习结合起来训练他们的系统，使用模仿学习训练 AI 从四个主要动作类别中选择一个动作（例如攻击、移动、购买、学习技能）。研究人员写道，使用模仿学习可以让研究人员“减轻直接处理大规模行为的沉重负担”。之后，系统使用强化学习来确定在每个类别中做出动作，例如攻击、学习等。他们的主要算法基于 OpenAI Five Dota 系统中使用的 PPO 算法设计。

结果：研究人员在两个领域测试其系统：受限制的 1v1 版本和 5v5 版本。对于这两款游戏，他们都会对内置的敌方 AI 进行测试。在 1v1 版本中，他们能够击败入门级、简单级和中级 AI。在 5v5 中，它们可以顺利击败入门级 AI，但简单级和中级 AI 相对有难度。“虽然我们的代理可以成功地学习一些合作策略，但我们还需要探索更有效的多代理协作方法，”他们写道。

重要性：这样的论文表明，AI 研究人员将实时策略游戏作为测试和校准强化学习系统性能的新方法之一。尽管本文中的技术成就似乎并不十分令人信服（如，我们不知道这样的系统如何对抗人类玩家），有趣的是这项研究成果来自于一个年轻的公司（ <10 年），这突出了亚洲科技公司在 AI 方面人力和财力的支持。

阅读更多：多代理 MOBA 游戏的分层强化学习（https://arxiv.org/abs/1901.08004）。

IBM 公布自动神经架构搜索的软件工具 NeuNets 细节

IBM 研究人员发布了 NeuNets 的详细信息，NeuNets 是该公司用于进行文本和图像域的自动神经架构搜索的软件工具。这是人工智能更广泛工业化的另一个表现，因为此类系统将 AI 系统设计过程进一步自动化。

NeuNetS 工作原理：NeuNetS 有三个主要组件：一个服务模块，为系统提供 API 接口；一个保持项目运行的引擎；以及一个合成器，IBM 称之为“可插拔的算法寄存器，它使用从引擎传递的状态信息来产生新的架构配置”。

NeuNetS 优化算法工作原理： NeuNetS 附带三层体系结构的搜索算法：NCEvolve，优化各种不同的架构方法并通过进化变异、训练优化架构的神经进化系统；TAPAS，是一个基于 CPU 的架构搜索系统；Hyperband 技术++，能“加快使用提前终止策略，自适应分配资源以进行随机搜索”，并已经扩展到重用一些已经搜到过的架构，加快其发现新的潜在高性能架构的速度。

结果：IBM 通过报告 GPU 时长来评估 NeuNetS 的各种训练组件的性能，以训练各种网络达到合理的准确度；这并不是一个很有用的对比指标，因为 IBM 忽略了报告其他系统的分数。

重要性：这样的论文表明：1）IBM 等传统公司正在接近更新的 AI 技术（如神经架构搜索），以及 2）公司打包各种 AI 技术融入到产品中，给了我们更多未来“软件 2.0”操作系统可能包含的细节。

阅读更多：NeuNetS：用于神经网络设计的自动合成引擎（https://arxiv.org/abs/1901.06261）。