高品质的音视频能力是怎样的? | Qcon 全球软件开发大会·上海站邀请函 了解详情
写点什么

贾佳亚:腾讯核心计算机视觉研究部门解密丨二叉树视频

  • 2019-09-02
  • 本文字数:1563 字

    阅读完需:约 5 分钟

贾佳亚:腾讯核心计算机视觉研究部门解密丨二叉树视频


嘉宾简介


贾佳亚博士,腾讯优图实验室杰出科学家(Distinguished Scientist),在腾讯负责计算机视觉、图像处理、模式识别、机器学习等人工智能领域的研究,及人工智能与各种应用场景结合的深度探索。贾佳亚是香港中文大学终身教授。加入腾讯前,他曾与微软研究院、谷歌、高通、英特尔、Adobe 等图像和人工智能研究机构开展过深度联合研究工作。贾佳亚博士在大学任职期间发表过逾百篇顶级会议和刊物论文。


视频地址:腾讯核心计算机视觉研究部门首次披露丨二叉树视频




我是从一个小城市出来的,所以接触计算机的时间并不是特别早,中学才开始,当时能用字符敲出几个图案出来,就会很开心了。


21 世纪初 20 世纪末的时候,我选择了计算机视觉这个方向,其实这条路当时并不好走,因为当时计算机视觉还没有清晰的定义,工业界都没有能够去想象视觉能干什么事情。所以当时的选择其实完全是基于自己对这种方向的一个热爱,相较于数据库等其他领域,视觉对我的感官会刺激性更大一点,所以我会有兴趣不断地去优化它、从而做得更好。所以,从博士到教授,我在香港中文大学做了十几年的计算机视觉方面的研究。


现在,我在腾讯优图团队任杰出科学家。腾讯优图是腾讯的核心计算机视觉研究部门。



腾讯内部各个部门的合作是非常紧密的,所以我们团队实际上形成了一个大的联合部门。围绕着视觉这样一个 AI 的核心技术,再发展到互联网,甚至是在其他行业的各个领域。把技术带到千家万户,是其中的重大原则和宗旨。


现在我们围绕两个中心来解决 AI 视觉的问题。


其中一个中心是将我们已有的技术直接拿过来转化成生产力,即一些能给普通用户使用的软件或 App。腾讯公司内部有非常强大的工程团队,我们能够做代码优化,我们能够做各种代码版本的卷积、算法的迭代,所以在公司内部有专门的队伍或人员来负责,我们可以很快地把技术运用到实践中。



另外一个中心是,希望能够利用我们现在对技术层面的一些积淀,比如说对于自然图像的理解,甚至是对语义分割的检测识别等等这样一些非常高端的算法,能够变成在某个场景中可以使用的事情。



其中,智能医疗就是一个非常重要的部分。医疗是一个场景,场景的背后是技术,背后是一套关于图像的语义分割和检测技术。


设想这样一个场景,当我们照了一张胸片,我们希望有一个智能的 AI 的工具能够去分析和诊断,判断是否需要做进一步的治疗,以及医生是否需要介入。


目前,优图医疗 AI 技术对早期肺癌的敏感度(即早期肺癌识别准备率)已达到 85% 以上,并与多家三甲医院展开合作。同时,腾讯优图的眼底模型通过检测患者眼部视网膜照片,可识别出眼部疾病早期阶段可能出现的动脉瘤,将“糖尿病视网膜病变”筛查准确率提升至 96%,几乎接近医生的诊断结果。


要实现这样的场景,前提一定是依赖于我们有非常强大的算法和工程能力,才能为智能医疗开端。



除了医疗上的应用,人脸识别在寻亲上也实现了落地合作。2017 年 3 月,依托腾讯优图人脸识别技术,福建省公安厅“牵挂你”防走失平台正式上线,截止目前已成功找回 681 名走失人员。不仅如此,基于优图实验室的人脸识别技术,QQ 全城助力上线了“人脸寻亲”功能,通过与宝贝回家和民政局的合作,上传被拐照片即可进行检索比对,即时呈现比对结果,帮助他们找到亲人。同时,以腾讯优图实验室跨年龄人脸识别技术为基础,只需要上传走失人口的照片,即可在失踪人脸数据库中进行检索比对,即时呈现比对结果。即使数据库中登记的是走失人口成年后的照片,也能通过跨年龄人脸识别技术根据其儿时照片进行匹配。


类似的场景越来越多,就越能解决和帮助到社会的进步,能让日常生活更加便利。



在公司,除了满足业务上的功能需求和业务目标,我希望当我们的团队足够大的时候,我们能够有一部分同学集中做前沿研究,同时多寻找一些真正对社会和民生有意义的东西去做,我相信这是我的个人价值,这本身也是公司的普世价值所在。



2019-09-02 14:015950
用户头像
二叉树视频 InfoQ旗下短视频品牌

发布了 98 篇内容, 共 27.5 次阅读, 收获喜欢 178 次。

关注

评论

发布
暂无评论
发现更多内容
贾佳亚:腾讯核心计算机视觉研究部门解密丨二叉树视频_AI_二叉树视频_InfoQ精选文章