资讯
加拿大今年再次将黑人 AI 研究人员“拒之门外”
“Black in AI“组织成立之初旨在为人工智能领域黑人研究人员提供技术共享平台,让全世界的黑人研究人员都能积极参与到人工智能研究中。去年,加拿大总理 Justin Trudeau 在一次新闻发布会上被问及,他是否知道与 Black in AI 有关的多名 AI 研究员被拒绝入境参加NeurIPS大会。Trudeau 表示他会对此事进行调查。显然,这位加拿大总理把自己说过的话抛诸脑后了,因为今年 NeurIPS 大会开始前又上演了相同的一幕。Black in AI 向 BBC 透露,他们知道现在仍有约 30 名研究人员被加拿大“拒之门外”无法前来参加大会。
“我们无数次提及,人工智能的主体是‘人’,而研究人员的多样性对于人工智能的发展尤为重要,这个问题必须要引起全世界的关注。”Black in AI 组织者 Charles Onu 对 BBC 如是说。
YC 撤出中国 陆奇自立门户
美国时间 11 月 21 日,创业投资加速器Y Combinator(简称 YC)官方博客称,由于 YC 领导层变动,因此公司总部调整了战略,决定将业务专注美国本土和国际市场。“现在不是运营在其他国家/地区运行 YC 的合适时机”。
2018 年夏天,陆奇加入 YC,帮助创建美国项目在中国的本地化版本——YC 中国。据陆奇介绍,YC 正式提出撤出中国的想法,是在 2019 年 5 月初,从今年秋季营开始招生之后。另外,YC 中国团队并没有散伙,一点都没变,只不过是以后要用陆奇和团队全新建立的“奇绩创坛”这个品牌来承接之前所有的东西。创业营也没有变,还是春季一次、秋季一次,所有的事情的进展、所有的招生都不变。
AI 读懂唇语 对社会将有哪些影响?
还记得电影《2001 太空漫游》中的一个场景吗?两名宇航员躲在一个小隔间里,躲避运行宇宙飞船的人工智能系统HAL。不幸的事,虽然 HAL 听不到宇航员在舱内的对话,但它可以透过窗户看到他们嘴唇。HAL 读懂了他们的唇语,明白了他们将要实行的计划,因此导致了宇航员悲剧的发生。现在,我们已经在着手开发能在有限条件下准确读懂唇语的人工智能。英国伦敦帝国理工学院、诺丁汉大学和三星人工智能中心的研究员们扩展了唇语识别数据集,以便人们更容易训练出在不同情况下能读懂唇语的系统。
为了完成目标,研究人员使用了一种被称为 3D morphable model(简称 3DMM)的技术来增加 LRW 中的数据(LRW 是一种流行的唇读识别数据集)。LRW 数据集收录了 1000 名说话者说出的 500 多个不同的单词,每个单词有 800 个语境。通过使用 3DMM 增加了 LRW 中的 face,使每个 face 在 3D 空间中倾斜,从而创建一个比原始 LRW 更具多样性的训练数据集。这个新数据集被称为 LRW in Large Pose (LP)。在实验中,研究人员能用增加的数据集来训练系统,准确率能达到 80%左右。尽管识别唇语真是一个难题,但他们在 Sentences 2 (LRS2) 数据库训练系统的准确率还是将近 60%,数据库里的大部分内容来源于 BBC 电视节目和新闻。“由于每个人说话时语句的长度和头部动作有很大差异,所以这是一项非常具有挑战性的工作”。他们还表明,当说话者远离摄像头且头部倾斜时,系统识别唇语的效果也非常好。
唇语识别是一个被大众广泛使用的人工智能技术——这项技术对耳聋或有听力障碍的人很有帮助,但它不可避免地会被用于监控领域,也会被大肆宣传。如果所有附在相机上的东西都能拥有“与人类一样”的感知力,那社会将变成什么样?
阿里王坚当选中国工程院院士
11 月 22 日,中国工程院 2019 年院士增选结果公布,阿里巴巴王坚当选中国工程院院士。
据悉,这是中国工程院开展的第 14 次院士增选和第 13 次外籍院士增选 ,共选举产生 75 位院士。其中,王坚博士当选中国工程院院士,属于工程管理学部。作为阿里巴巴技术委员会主席、阿里云创始人、2050 志愿者,王坚还是云栖小镇的创立者和“名誉镇长” ,并且是 TGO 鲲鹏会荣誉导师。
王坚博士在 2017 年 12 月北京 ArchSummit 全球架构师峰会上演讲时提到,好的架构是能包容所有技术的前提,同时鼓励年轻技术人应该有信心,设计一个好的架构,让机器更好的服务人类。
OpenAI 发布增强强化学习安全性的 Safety Gym
11 月 22 日,OpenAI发布了一款增强强化学习安全性的 Safety Gym。 OpenAI 将其描述为一套用于开发 AI 的场景和工具,该 AI 在训练时遵守安全约束,并比较算法的“安全性”以及这些算法在学习中可能能避免错误的程度。
迄今为止,尽管数据科学领域的许多工作都集中在算法的规模和复杂性上,但是安全仍然是一个值得追求的领域——在自动驾驶汽车之类的应用中尤其如此,因为机器学习系统的错误判断可能会导致事故。这就是为什么像英特尔的 Mobileye 和英伟达这样的公司提出框架来保证安全和合理的决策的原因,同理——这也是为什么 OpenAI 发布了 Safety Gym。
官宣!AI 语音大牛 Daniel Povey 加入小米
11 月 18 日,雷军在社交媒体宣布了一则人事任命消息。国际语音识别和 AI 领域专家、语音识别开源工具 Kaldi 之父、前霍普金斯大学副教授 Daniel Povey 将出任小米集团语音首席科学家。
有消息称,Povey 曾于 9 月中旬来过中国并与多家公司接洽。在今年 8 月,有外媒报道,Daniel Povey 拒绝了 Facebook 的工作邀约,Povey 表示,他不准备在 Facebook 工作,因为 Facebook 的“进步思想”与学术界的思想不能相提并论。他计划与一家未具名的中国公司或大学合作进行语音识别和机器学习。他还表示,“在中国人中间,我会感到更加放松,因为他们没有美国式的社会正义战士。”
在加入小米之前,Daniel Povey 曾在约翰霍普金斯大学,担任语言和语音处理中心的副教授。今年 5 月,在该校任职 7 年的 Daniel Povey 因反对学生抗议事件遭学校停职。
Daniel Povey 是语音识别和 AI 领域的知名专家,他是语音识别开源工具 Kaldi 的主要开发者和维护者,被称为” 语音识别开源工具 Kaldi 之父 “。Kaldi 是目前全球语音界最火的开源项目,其自 2011 年发布以来,下载量已超过了两万多次,合著的论文被引用一千多次。Daniel Povey 领导的 Kaldi 社区,聚集了全球众多学者、科学家、工程师,在语音识别、语音合成、声纹识别及机器学习领域有着广泛的应用,几乎所有的语音团队都在使用 Kaldi 引擎来开发智能解决方案。
微软将开放神经网络交换格式 ONNX 贡献给 Linux 基金会
Linux 基金会旗下的 AI 基金会(LF AI)正致力于打造一个生态系统,以维持人工智能(AI)、机器学习(ML)和深度学习(DL)的开源创新。日前该组织宣布,开放神经网络交换(ONNX)已成为其中的最新项目。
ONNX 最初由微软和 Facebook 在 2017 年开发并开源,旨在更轻松地创建和部署机器学习应用程序。ONNX 为深度学习模型和传统机器学习模型提供了通用表现形式,从而实现了框架、编译器、运行时和硬件加速器之间的互操作性。ONNX 还具有众多优势,其中包括可移植性,它使 AI 开发人员可以更轻松地在受信任的 AI/ML/DL 工作流程中的工具之间移动 AI 模型。
“我们很高兴欢迎 ONNX 加入 LF AI 基金会。我们将 ONNX 视为开源 AI 持续增长的关键项目”, LF AI Foundation 理事会主席 Mazin Gilbert 表示。 “我们致力于扩展开源 AI,并支持信任、透明和可访问的社区发展。” 微软 Azure AI 公司副总裁 ERIC BOYD 在公告中写道,“我们为 ONNX 所取得的进展感到自豪,并希望表彰整个 ONNX 社区的贡献、想法和热情。我们对 ONNX 以及未来的一切感到兴奋。”
苹果市值突破 1.2 万亿美元
11 月 20 日消息,苹果市值突破 1.2 万亿美元,这使其距离估值 1.3 万亿美元(倪光南院士所言)的华为仅一步之遥。苹果以 iPhone、iPad、Mac、Apple Watch、Airpods、iOS、内容产品服务等构建起的产品服务整体整体优势强大,特别是在可穿戴设备和服务市场这种具备强大发展潜力的业务上,苹果领先优势明显,而他们在未来所具备的广阔发展空间,显然也能让苹果收获更大的发展空间。
美国军方用面部识别技术都做了什么?
最新公布的文件披露了美国军方使用人脸识别技术的细节。自动生物识别信息系统(ABIS)是一个生物识别数据库,里面收录了 740 万人的信息,每位与美国军方有过接触的人的信息都在其中,包括盟军士兵。ABIS 与联邦调查局的中央数据库相连,中央数据库又与美国各州和地方数据库相连。2019 年上半年,成千上万的人通过生物特征监察名单(ABIS 的一个子集)被识别出来。2008 年至 2017 年,美国国防部将 21.3 万人列入监察名单,根据生物特征和法医鉴定比对,逮捕或击杀了 1700 人。
今年早些时候,Axon 伦理委员会认为,人脸识别技术还不够可靠,不能用于警察随身摄像头。在军事行动中,识别的准确性对完成军事行动和减少平民伤害至关重要,所以这些技术还没有过早地投入使用,目前它们的使用还需受到适当的监督。
声音
比尔·盖茨:AI 领域“固步自封”的企业终将被淘汰
11 月 21 日,微软联合创始人比尔·盖茨在出席“2019 北京彭博新经济论坛”中提到,共享研究成果是招揽人才的“利器”,盖茨说,他参观过微软在北京的人工智能研究实验室,并指出共享研究是微软员工来微软工作的首要原因之一。
中美两国在 AI 领域研究都处于世界领先水平,但是政治紧张环境升级延缓了双方在 AI 领域的合作。盖茨表示他很难理解如何限制科学研究的共享。“你真的没办法像传递小纸条一样,把纸条上的信息传递给接收人,同时告诉这个人不要把内容透露给某个人,因为那个人是中国人。”盖茨如是说。盖茨称美国长期受益于这种开放的研究成果共享,这种方式仍让很多人从中受益,人工智能领域体现得尤为明显。“AI 技术不可能‘闭门造车’,拥有开放系统的主体一定会走在行业前列,而那些‘固步自封’的主体终究会被淘汰。”
倪光南:华为业内估值 1.3 万亿美元
近日,由软件绿色联盟主办,阿里巴巴、腾讯、百度、网易、华为五家企业协办的第二届“软件绿色联盟开发者大会”在北京国家会议中心举行。会上,中国工程院院士倪光南做了题为《自主创新 迎接软硬件生态新潮流》的演讲。
倪光南院士首先分享了中国网络信息技术领域总体态势。当下,网络信息领域技术新,发展快,人才作用大,中国有后发优势:“网络信息技术是全球研发投入最集中、创新最活跃、应用最广泛、辐射带动作用最大的技术创新领域,是全球技术创新的竞争高地。”他表示:中国网信领域总体技术和产业的水平在世界上居第二位,仅次于美国。目前,在全球前 10 家市值最大的 ICT 企业中,美国有 6 家,中国有 3 家(华为、阿里、腾讯),韩国也有 1 家(三星)。
虽然华为未上市,但根据业内估值,其市值高达 1.3 万亿美元,超过微软、苹果位列第一。
AI 开源工具
Gaussian YOLOv3
Gaussian YOLOv3 是自动驾驶领域一款高精准、快速反应目标检测器。自动驾驶技术有很多崇拜者,但是由于政策、基础设施和社区接受程度等因素限制导致其发展缓慢,当然也有一些算法和框架为自动驾驶的未来提供了保障。
Gaussian YOLOv3 架构提升了系统的检测准确性,并能支持实时操作(这是关键一环)。与传统 YOLOv3 相比,Gaussian YOLOv3 将 KITTI 和 Berkeley Deep Drive(BDD)数据集的平均精度分别提高了 3.09 和 3.5。
https://github.com/jwchoi384/Gaussian_YOLOv3
RoughViz
RoughViz 是一款很棒的JavaScript数据可视化库,能够生成手绘草图或可视化数据,基于 D3v5、roughjs 和 handy。可以按下列指令安装 RoughViz:
https://github.com/jwilber/roughViz
评论