Skip to end of metadata
Go to start of metadata

2019年9月17日,OMAHA首次发布“药品适应证”知识图谱数据资源,并持续维护更新。

为了更好地促进计算机对于知识体系的应用,我们以OMAHA七巧板医学术语集为基础,对知识图谱的实体的内容进行了标准化和概念化,助力系统实现语义层面的互操作。

本应用指南对实体、关系、构建方式、属性值、发布数据统计、数据资源下载等内容进行了解释说明,供使用者了解具体的构建思路,帮助更精准地应用该资源。

关系表达模型


基于中国药典、药品说明书和标签管理规规范、药品说明、医保药品目录等资料,总结并构建了药品适应证的关系模型,主要包括以下关系:用药目的、适用人群、适应证、医保支付类别、剂型,具体关系的解释说明见下表

1药品-适应证关系表达模型

关系

定义

药品

用药目的

用药目的

指用药的最终目标,是治疗或缓解症状还是预防相关疾病等。

药品

适用人群

人群

指适宜用于具有一些相同特征的人群。

药品


适应证

临床所见


指药物适用于某种疾病、症状、操作等情况。

药品

操作

药品

事件

药品剂型剂型表示药物制剂的形态。
药品医保支付类别文本指药品在各地的医保目录中的报销类别。

完整的OMAHA知识图谱schema详见:http://schema.omaha.org.cn/class/Thing

构建方式


数据来源

原始数据来源于各地药品医保目录、药品说明书等开放数据,以及中国药典、药理学等高质量医学资源。

构建规则

  1. 通过自然语言处理与文本挖掘技术,采用机器结合人工相结合的方式进行构建;
  2. 为了药品适应证能够更加精确的表达,将用药目的、适用人群、适应证进行成组表示:
    • 其中各关系数量为:x个用药目的(x≥0)、y类适用人群(y≥0)、z个适应证(z≥1),
    • 每个关系组内 用药目的、适用人群、适应证最多只会存在一条,且用药目的、适用人群必须与与适应证成组存在,不可单独存在;
    • 若相同适应证存在多个用药目的或多个适用人群,则以多条关系成组存在;

质量控制

  1.  实体都最大化与“七巧板”医学术语集建立映射,保证数据的标准化和深度应用;
  2.  最终所有数据都由专业人员进行了审核,确保内容的正确性。


属性值说明


适应证

药品的适应证的取值内容已最大化映射至“七巧板”医学术语集中的“临床所见”、 操作”、 “事件”等领域的概念。

其中目前无法引用“OMAHA七巧板医学术语集”的情况主要为术语集暂未收录相关概念。对于该部分内容新增相应的实体,并与OMAHA“七巧板”医学术语集中的相关概念所映射的实体都建立层级关系(is-a);同时为尽可能具体地表达适应证的语义内涵,也建立相关属性关系。

用药目的

OMAHA知识图谱的限定词中“用药目的”类的术语,为可枚举的限定词。部分举例如下:

“用药目的”属性的属性值为“用药目的”类,主要划分为“治疗用药”、“辅助治疗用药”、“预防用药”、“诊断用药”、“操作用药”等,术语解释如下:

1.    治疗用药:是指一切以解除病痛为核心的用药目的,包括一般意义上的治疗、对症治疗和姑息治疗等;

2.    辅助治疗用药:是指药品在治疗行为过程中起辅助作用,包括消毒用药、康复用药、恶性肿瘤辅助用药等;

3.    预防用药:是指药品用于预防某种疾病的发生,如疫苗接种、健康危险因素预防等;

4.    诊断用药:是指药品用于某种疾病的诊断过程当中,包括直接诊断、辅助诊断等;

5.    操作用药:是指药品用于某项临床操作过程中,如手术用药、检查用药、麻醉用药等。

适用人群

OMAHA知识图谱中 “人群”类的术语,部分举例如下:

“适用人群”属性的属性值为“人群”类,主要划分标准为年龄、性别和临床特征等。一些特殊的术语解释和概念定义如下:

1.    新生儿:指出生28天以内的人群;

2.    婴儿:指1岁以内的人群;

3.    幼儿:指1岁至3岁之间的人群;

4.    儿童:指14岁以下的人群;

5.    青少年:指14岁至18岁之间的人群;

6.    青年:指14岁至35岁之间的人群;

7.    育龄女性:指15岁至49岁之间的女性人群;

8.    中老年人:指45岁以上人群;

9.    老年人:指60岁以上人群。

医保支付类别

甲类:临床治疗必需、使用广泛、疗效好,同类药品中价格低的药品。参保人使用这类药品时,可以全额纳入报销范围,按规定比例报销。

乙类:可供临床治疗选择使用、疗效好,同类药品中比甲类药品价格高的药品。参保人使用这类药品时,要先按比例(各地不同)扣除一定的个人自付费用后,将余下费用再纳入报销范围,按规定比例报销。

剂型

剂型取值内容已完全映射至“七巧板”医学术语集中的“剂型”语义标签下的概念。


最新发布数据统计


实体统计

实体语义类型的详细统计如下表:

实体语义类型数量
药品21002
临床所见10365
疾病9112
操作366
观测操作307
剂型151
人群61
事件27
用药目的5
合计41396

关系统计

关系类型的详细统计如下表:

关系类型数量
适应证114474
用药目的114394
医保支付类别96848
剂型54235
名称41396
OMAHA概念ID26996
别称17591
适用人群2757
合计468691

映射统计

最新发布包中包含与“七巧板”医学术语集的映射关系,有映射实体的语义类型详细统计如下表:

映射语义类型数量
药品20846
疾病4842
临床所见809
观测操作180
操作169
剂型150
合计26996


样例数据下载


为让大家对知识图谱有更直观的了解途径,现从发布内容中摘取了部分内容作为样例数据,欢迎下载!

点击下载

  • No labels