产品战略专家梁宁确认出席AICon北京站,分享AI时代下的商业逻辑与产品需求 了解详情
写点什么

医疗 AI 落地利器:腾讯优图开源业界首个 3D 医疗影像大数据预训练模型

  • 2019-08-08
  • 本文字数:1474 字

    阅读完需:约 5 分钟

医疗AI落地利器:腾讯优图开源业界首个3D医疗影像大数据预训练模型


近日,腾讯优图首个医疗 AI 深度学习预训练模型 MedicalNet 正式对外开源。这也是全球第一个提供多种 3D 医疗影像专用预训练模型的项目,将为全球医疗 AI 发展提供基础。


许多研究表明,深度学习的发展非常依赖数据量。自然图像领域中存在着许多海量数据集,如 ImageNet,MSCOCO。基于这些数据集产生的预训练模型推动了分类、检测、分割等应用的进步。不同于自然图像,医疗影像大部分都是 3D 结构形态的,同时,由于数据获取和标注难度大,数据量稀少,目前尚未存在海量数据集及对应的预训练模型。


MedicalNet 是腾讯优图首个专为 3D 医疗影像在深度学习应用上所开发的一系列预训练模型,为任何 3D 医疗影像 AI 应用起到“打地基”的作用,加快模型收敛,减轻模型对数据量的依赖,MedicalNet 具备以下特性:


  1. MedicalNet 提供的预训练网络可迁移到任何 3D 医疗影像的 AI 应用中,包括但不限于分割、检测、分类等任务;

  2. 尤其适用小数据医疗影像 AI 场景,能加快网络收敛,提升网络性能;

  3. 通过简单配置少量接口参数值,即可进行微调训练;

  4. 项目提供多卡训练以及测试评估代码,接口丰富,扩展性强;

  5. 提供不同深度 3D ResNet 预训练模型,可供不同数据量级应用使用。


为了产生 3D 医疗影像的预训练模型,MedicalNet 聚集多个来自不同 3D 医疗领域的语义分割小规模数据集,并提出了基于多分支解码器的多域联合训练模型来解决数据集中的标注缺失问题。我们的预训练模型可以迁移到任何 3D 医疗影像应用的深度学习模型中。整个系统的工作流程如下图所示:



我们将 MedicalNet 模型迁移到预训练时未接触过的 Visceral 和 LIDC 数据集中,完成全新的肺部分割和肺结节分类任务,并与目前常用的从零训练(train from scratch)以及 Kinetics 视频 3D 预训练模型在性能以及收敛速度上做了比较。在肺部分割应用上,相比于 Train from Scratch,MedicalNet 在 Dice 上有 16%到 33%幅度的提升,相比于 Kinetics 有 4%到 7%幅度的提升。在肺结节良恶性分类应用上,相比于 Train from Scratch,MedicalNet 有 6%到 23%幅度的预测正确率(Acc)提升,相比于 Kinetics 有 7%到 20%幅度的提升。


在收敛速度上,实验证明,无论是在肺分割任务还是肺结节分类任务上,MedicalNet 均能为模型提供一个较低的初始化损失值,明显加快损失下降速度,下图为 MedicalNet 性能的一个简单示例,展示了在全器官分割应用中,不同预训练方式在一定训练迭代次数下的测试结果。可以看出,基于我们的预训练模型(MedicalNet)的结果最接近标签(ground truth),且远优于从零训练(train from scratch)的结果,更多细节请参考论文[footnoteRef:1]。



随着人工智能的火热化,医疗影像 AI 也成为了当前各应用领域中最热门的版块。区别于其他人工智能应用,人工智能在医疗领域的应用门槛最高,最大的原因在于标注数据的匮乏。医疗影像数据的获取通常需要经历重重关卡,同时,由于领域的专一性,数据通常需要资深医师标注,而每个 3D 数据的标注耗时耗力。在当前紧张的医护资源下,医疗影像数据的获取战线将非常漫长,大大阻碍了应用落地的进程。再者,标注数据量相当有限,大部分医疗部门都需要面临数据量稀少和深度学习之间的鸿沟


专有领域专有模型,MedicalNet 相当于为各个 3D 医疗影像应用准备了具备临床通用知识的数据库。即使在小数据量中,该数据库的有效特征也能帮助落地应用取得较好的医疗检测性能,这大大减轻医疗影像 AI 应用对数据量的依赖,进而实现落地需求并加快落地速度


腾讯优图表示,MedicalNet 是腾讯在医疗 AI 领域的首个开源项目,后续将继续提供更多类型的模型,为全球医疗 AI 的基础建设助力。


2019-08-08 17:199618

评论

发布
暂无评论
发现更多内容

企业知识管理系统应具备的功能

小炮

WebStorm注册码_WebStorm2022年激活永久实测有效

Geek_75f9e9

webstorm

一文掌握软件安全必备技术 SAST

SEAL安全

网络安全 软件安全 SAST工具 SAST

大数据培训flink窗口(Windows)的表现形式

@零度

大数据开发

Linux开发_动态静态库创建与Makefile规则

DS小龙哥

6月月更

远程办公带来的挑战和变化 | 社区征文

编程攻略

初夏征文

还不知道npm私服?一篇教会你搭建私服并发布vue3组件库到nexus

Jianmu

ci 前端 npm Vue3 私服

洞见科技当选中国信通院隐私计算联盟「副理事长+政务应用工作组组长」单位

洞见科技

隐私计算

得物前端唤端业务场景和技术精讲

得物技术

前端 前端教程 等待唤醒 业务场景 前端工具

Java项目集成activity工作流,快速开发业务审批单据(低代码,敏捷)

金陵老街

敏捷 springboot Activity Vue 3 BPMN

JavaScript期约Promise

大熊G

JavaScript 前端 6月月更

java编程培训Mybatis的增删改查与获取参数值

@零度

mybatis JAVA开发

Java—线程安全II

武师叔

6月月更

影响软件公司开发价格的因素有很多,你知道吗?

开源直播系统源码

软件开发流程 直播系统 app源码 直播源码 定制软件开发

【直播回顾】战码先锋第五期:深入理解OpenHarmony系统启动,轻松踏上设备软件开发之旅

OpenHarmony开发者

Open Harmony

NFT卡牌盲盒链游系统dapp开发搭建

薇電13242772558

智能合约 NFT

数字化转型之数字资产知识库(springboot+es+vue+neo4j)

金陵老街

全文检索 知识图谱 Vue 3 spring-boot

洞见科技荣获「最受投资人欢迎的隐私计算服务企业」奖

洞见科技

隐私计算 数据要素

【Python技能树共建】验证码实操2案例

梦想橡皮擦

6月月更

运营商动态路由的神器 :IS-IS 协议

wljslmz

6月月更 路由协议 IS-IS

测试基础之:测试覆盖率

甜甜的白桃

软件测试 测试覆盖率 JACOCO 6月月更

莫把暑假插错秧,代码哪有足球香,Alluxio足球青训营在线摇人!

Alluxio

微软 开源 足球 分布式, CCF开源高校行

Vue-10-class的动态绑定

Python研究所

6月月更

谈谈 JDK 和 SAPMachine 的关系

汪子熙

Java jdk jre SAP 6月月更

千亿参数“一口闷”?大模型训练必备四种策略

OneFlow

人工智能 模型训练 策略

技术分享| 云服务器的使用-nginx的安装及使用

anyRTC开发者

nginx centos 音视频 服务器

InfoQ 极客传媒 15 周年庆征文|手摸手教你在Windows安装Docker,一定要看到最后

迷彩

Docker 架构 运维 6月月更 InfoQ极客传媒15周年庆

市值严重低估,现金15亿,百世走的路对吗?

科技新知

开课报名|「Takin开源特训营」第一期来啦!手把手教你搞定全链路压测!

TakinTalks稳定性社区

开源 全链路压测 生产环境全链路压测 安全生产 稳定性保障

如何制定业务的故障分级标准?

华仔

架构实战营 故障定级 故障分级

谷歌AI人格觉醒“喜提”热搜,我们找清华大佬聊了聊 AI 对话系统的惊人进展

硬科技星球

人工智能 谷歌 图灵测试

医疗AI落地利器:腾讯优图开源业界首个3D医疗影像大数据预训练模型_AI&大模型_云加社区_InfoQ精选文章