Amazon Comprehend 是一项使用机器学习在非结构化文本中发现见解的自然语言处理 (NLP) 服务。使用非常简单,不需要具备任何机器学习经验。 您可以针对自己的特殊用途自定义 Comprehend。例如创建自定义文档分类器,以将文档整理到您自己的类别中,或者自定义实体类型来分析文本中的特定术语。 但医学术语可能非常复杂,而且特定于医疗保健领域。
为此,去年我们发布了 Amazon Comprehend Medical,这是一项符合 HIPAA 要求的自然语言处理服务,让用户可利用机器学习技术轻松从非结构化文本中提取相关医疗信息。借助 Comprehend Medical,您可以从医生诊断书、临床试验报告和患者个人健康档案等各种来源中,快速准确地收集信息,例如医疗状况、药物、剂量、强度和频率。
今天,我们增加了将 Comprehend Medical 提取的信息链接到医学本体的功能。
本体提供某个领域的声明式模型,该模型可定义并表示特定领域中存在的概念、其属性以及它们之间的关系。它通常表现为知识库,并可供需要使用或共享知识的应用程序使用。在健康信息学中,本体是对健康相关领域的形式化描述。
Comprehend Medical 支持的本体包括:
ICD-10-CM – 将医疗状况识别为实体,并将诊断结论、严重性和解剖学差异等相关信息链接为该实体的属性。 这是一个诊断代码集,对人口健康分析以及根据提供的医疗服务从保险公司获得赔付非常有用。
RxNorm – 将药物识别为实体,并将剂量、频率、强度和给药途径等属性链接到该实体。 医疗保健提供商使用这些概念来实现相应的目的,例如药物核对,该核对过程可确保创建最能准确反映患者所用所有药物的清单。
Comprehend Medical 为针对每个实体返回一个潜在匹配项的排序表。您可以使用置信度来确定哪些匹配项有意义,哪些匹配项还需进一步审查。我们来通过一个示例了解下具体的工作原理。
**使用本体链接
**在 Comprehend Medical 控制台中,我先在输入中提供一些非结构化的医生诊断书文本:
首先,我使用 Comprehend Medical 中已经可用的一些功能来检测受保护的健康信息 (PHI) 实体。
识别的实体(参阅此处博文了解详情)中包含一些症状和药物。药物被识别为产品或品牌。我们来看看如何将其中一些实体与更具体的概念联系起来。
我使用新增功能将这些实体链接到药物的 RxNorm 概念。
文本中,只有涉及药物的内容会被检测到。我可以在答案详情中看到更多的信息。 例如,我们来看一个检测到的药物:
“Clonidine”这个词第一次出现(上述输入文本中的第二行)时链接到 RxNorm 本体中的产品概念(下图左侧)。
“Clonidine”这个词第二次出现(上述输入文本中的第四行)时后跟明确的剂量,并链接到 RxNorm 本体中更规范的格式,包括剂量(下图右侧)。
为了使用 ICD-10-CM 概念查找医疗状况,我输入其他内容:
想法还是将检测到的实体(例如症状和诊断结论)链接到具体的概念。
本文转载自 AWS 技术博客。
原文链接:https://amazonaws-china.com/cn/blogs/china/new-amazon-comprehend-medical-adds-ontology-linking/
评论