QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

腾讯 AI Lab“绝悟”首次将强化学习引入病理全片扫描,阅片效率提升 400%

  • 2022-12-23
    北京
  • 本文字数:1995 字

    阅读完需:约 7 分钟

腾讯AI Lab“绝悟”首次将强化学习引入病理全片扫描,阅片效率提升400%

12 月 19 日,腾讯 AI Lab 发布其决策智能 AI 「绝悟」的最新成果「绝悟 RLogist」,将 AI 深度强化学习技术迁移到病理全片扫描图像诊断领域,在性能接近的情况下,将传统病理阅片效率提升 400%。


该研究相关论文被国际人工智能顶级学术会议 「AAAI 2023」接收,代码已开源。



相关论文:


论文链接:http://arxiv.org/abs/2212.01737


开源链接:https://github.com/tencent-ailab/RLogist


「绝悟」AI 是腾讯将游戏场景与人工智能技术进行融合研究的核心探索之一,此前先后在 MOBA、RTS、3D 开放世界(Minecraft)等多类型游戏中取得了业界领先的研究成果,证明了其在游戏复杂环境中较为优秀的决策智能水平。


本次发布的「绝悟 RLogist」受启发于「绝悟」在 3D 游戏环境中进行观测并做出决策的过程,将这些能力迁移至病理阅片场景,提出了基于深度强化学习找寻最优看片路径的方法,并在相关测试数据集中表现出较高的效率,达到业界领先水平。这也代表着「绝悟」从游戏场景走向现实世界,朝着解决更多现实世界难题的目标更近了一步。

让 AI 学习医生决策思维方式

随着技术发展,目前,病理行业正在加速向全数字化、智能化、云端化方向发展,临床科室常常将组织切片进行全片扫描数字化处理,以便医生阅片及管理。


数据显示,显微扫描仪生成的高分辨率图像往往能够达到每个像素 0.25 微米,每张图像的尺寸经常是几万乘几万像素甚至更高,虽然这能更全面地展现切片信息,却也给医生的阅片带来了更大的压力,他们要从布满密集细胞和组织的超大尺寸图像中,肉眼找到风险的病灶位置并进行判断,“大海捞针”式的工作难度可想而知。


在高清病理图像中,病灶区域可能仅占很小的比例


近年来,随着技术的发展,研究员尝试使用深度学习解决图像/像素级分类和回归问题,对医学图像分析领域作出了很大贡献,然而,全片扫描图像分析对于深度学习仍然具有挑战性。主要挑战来自两个方向:


第一,计算病理学中的病理图像(WSI)具有十亿像素大小的高分辨率,却往往只有一个图像级标签。目前绝大部分的方法都依赖于在高倍镜下对全切片进行密集采样的方式进行特征提取,并对所有采集特征进行信息整合进而实现全片诊断。


第二,这些图像的兴趣点区域(病变区域)往往很稀疏。这带来了诊断相关性弱、数据效率低下等问题。现有的方法大多依赖于多实例学习框架,需要在高倍率下密集采样局部的图像块(patch),增加了计算成本,一张切片往往需要几十分钟来完成计算。这限制了很多潜在的临床应用场景,比如大规模筛查和术中快速评测。


实际上,病理医生在对切片进行判读时,并不需要像这些计算机算法这样依次去观察高倍镜下的每一个角落。病理医生往往先利用显微镜在低倍镜下进行扫片,在高倍镜下确认相关区域,必要时可以灵活切换不同倍镜进行复核,根据经验决策最优的查看路径,以最终完成全片判读并定位到关键病灶。


人类医生会凭经验放大图像,检查可疑区域


「绝悟」团队观察到,病理医生的阅片行为,可以转化为最优路径决策问题,而解决这类问题正是强化学习所擅长的方向。以「绝悟」在 Minecraft 环境中完成挖木头任务为例,AI 首先要环顾四周搜集全局信息(类比病理医生在低倍镜下扫片),然后锁定视角(高倍镜确认),找到木头后执行采集动作(确认病灶),如此往复。


受此启发,「绝悟 RLogist」创新性地尝试了一种类似医生病理阅片的决策思路,采用了基于深度强化学习的,找寻最优看片路径的方法,避免了用传统的穷举方式去分析局部图像切块,而是先决策找到有观察价值的区域,并通过跨多个分辨率级别获得代表性特征,以加速完成全片判读。

成果验证:决策提效 400%

研究团队选择“淋巴结切片转移检测”及“肺癌分型”两个全片扫描图像的分类任务进行基准测试(TCGA-NSCLC 和 CAMELYON16 WSI 数据集)。结果表明,与典型的多实例学习算法相比,「绝悟 RLogist」在观察路径显著变短情况下,能够实现接近的分类表现,决策效率提升 400%。




同时,该方法具体较好的可解释性。通过将「绝悟 RLogist」的决策过程可视化,有潜力应用于教育性或者辅助性的医疗诊断场景。



研究员表示,未来团队将沿着两大路径持续优化,一方面,通过引入更强的神经网络结构增强「绝悟 RLogist」的表征学习能力,另一方面,使用更高阶的 RL 训练方法避免学习到错误的观测路径,相信未来能在该领域进一步发挥 AI 技术的作用。

从虚拟到现实,让游戏 AI 走入现实世界


在 AI 游戏方面,腾讯 AI Lab 自主研发的深度强化学习智能体正不断走近现实。除了「绝悟」,此前推出的棋牌游戏 AI 「绝艺」在担任国家围棋队训练专用 AI 同时,逐步拓展麻将等非完全信息类博弈能力。


同时,基于对强化学习技术前景的关注,实验室正积极促进强化学习领域的共同发展。2019 年,腾讯 AI Lab 与王者荣耀共同发布 AI 开放研究平台「开悟」,过去三年已通过「以赛促研」助力高校 AI 人才培养。11 月 21 日,平台发布「王者荣耀 AI 开放研究环境」,为非商业用途的机器学习算法研究公开提供业界独有的高复杂度 MOBA 训练环境,助力前沿探索。

2022-12-23 10:424847
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 554.9 次阅读, 收获喜欢 1978 次。

关注

评论

发布
暂无评论
发现更多内容

Vue组件间的传值五大场景,你造吗?

华为云开发者联盟

Vue 组件 传值

大专的我狂刷29天“阿里内部面试笔记”最终直接斩获十七个Offer

Java 编程 程序员 架构师 计算机

肝完这在“牛客网”难倒万人的Java面试题后,已收获9个大厂offer

java小李

Sprint Boot git reset spring cloud alibaba

马士兵「研发」对标阿里Java架构师P5—P9成长路线,文档+教程

Java架构追梦

Java 数据库 架构 JVM 多线程与高并发

330页PDF,10万字的知识点总结,架构师必备!

欢喜学安卓

android 程序员 面试 移动开发

裸辞后吊打大厂面试官,四面拿到阿里offer后我还是选择了美团

java小李

tomcat elasticsearch

浅谈工业4.0背景下的空中数据端口,无人机 3D 可视化系统的应用

一只数据鲸鱼

无人机 数据可视化 工业4.0 数字孪生 智慧工业

差之毫厘:etcd 3 完美支持 HTTP 访问?

API7.ai 技术团队

etcd 网关 APISIX

基于docker的分布式性能测试框架功能验证(一)

FunTester

性能测试 接口测试 测试框架 测试开发 分布式压测

直呼内行!靠着这份阿里10w字面试总结,我成功收到了4个大厂offer

Java 程序员 架构 面试 计算机

询盘获客软件系统开发详情

搜客系统软件开发公司

Go语言:如何通过 RPC 来实现跨平台服务!

微客鸟窝

Go 语言

一周信创舆情观察(7.19~7.25)

统小信uos

架构训练营毕业设计

Geek_649372

架构训练营

AI智能获客询盘软件系统开发公司

系统性能优化-缓存

计算机 计算机缓存

5年经验Android程序员面试27天,从理论到实践!

欢喜学安卓

android 程序员 面试 移动开发

短视频SEO获客系统软件开发简介

只出现一次的数字

Memorys

Java 面试 算法

详解云安全攻防模型,这些攻击战略和战术越早知道越好!

博文视点Broadview

10天拿到腾讯Android岗offer,大厂直通车!

欢喜学安卓

android 程序员 面试 移动开发

短视频营销获客软件系统开发内容

仅仅上线一小时,下载量就破10W!阿里内部Java性能优化实战手册

java小李

面试 JVM

5 分钟,从 0 到 1 上线个人网站!

程序员鱼皮

JavaScript GitHub 大前端 Web 计算机

短视频询盘获客系统软件开发价格

抖音获客APP开发,抖音获客系统开发(成功案例),抖音获客系统源码

系统开发咨询1357O98O718

MEMS加速度计如何选型?

不脱发的程序猿

物联网 传感器 ADI MEMS加速度计 期刊论文

逆袭成功,不愧是阿里内部面试参考指南,已帮我拿下了8个大厂的offer

Java 程序员 架构 面试 计算机

中国RPA厂商首次入选Gartner RPA魔力象限,背后的意义是什么?

王吉伟频道

AI RPA 机器人流程自动化 Gartner 国产RPA

分布式性能测试框架用例方案设想(一)

FunTester

性能测试 接口测试 测试框架 测试开发 分布式压测

腾讯AI Lab“绝悟”首次将强化学习引入病理全片扫描,阅片效率提升400%_AI&大模型_刘燕_InfoQ精选文章