1.OMAHA医学本体概述

“七巧板”术语集是基于本体的方式构建,包含疾病、症状、体征、解剖、手术、生物、药品、医疗器械、检验检查、影像、护理、基因、基因突变等医学领域的术语,且未来术语的范围将会结合行业需求持续进行拓展。通过严谨规范的术语创建和维护规则,形成可供行业复用的高质量的中文术语集,并持续进行维护更新。

OMAHA医学本体采用OWL 2 EL[1]标准。OWL 2 EL是OWL 2的一个子集,具有以下特点:

  • 特别适用于具有大量类(class)和属性(property)的本体。

  • 本体一致性(ontology consistency)、类包含(class expression subsumption)和实例检测(instance checking)可以在多项式时间内完成。

2.OMAHA医学本体组成

OMAHA医学本体由实体、公理和表达式组成:

公理(axiom): OMAHA医学本体表达的基本陈述。

实体(entity):用来表示医学领域中的对象。实体包括类、数据类型(datatype)、对象属性(object property)、注释属性(annotation property)和命名个体(named individual)。类用于对具有共同点的个体进行分组。对象属性以不同的方式把类联系起来,数据类型是指数据值的不同类型。注释属性是对本体添加额外的描述。命名个体是指经过明确声明的个体。

表达式(expression): 由基本的实体组合而成的复杂的语句。

2.1公理

OMAHA医学本体支持下列公理:

  • 子类:SubClassOf

  • 类的等价:EquivalentClasses

  • 类的不相交:DisjointClasses

  • 带或不带属性链的对象属性的包含:SubObjectPropertyOf

  • 数据属性的包含:SubDataPropertyOf

  • 对象属性的等价:EquivalentObjectProperties

  • 数据属性的等价:EquivalentDataProperties

  • 传递的对象属性:TransitiveObjectProperty

  • 自返的对象属性:ReflexiveObjectProperty

  • 对象属性的域约束:ObjectPropertyDomain

  • 数据属性的域约束:DataPropertyDomain

  • 对象属性的值约束:ObjectPropertyRange

  • 数据属性的值约束:DataPropertyRange

  • 断言:SameIndividual,DifferentIndividuals,ClassAssertion,ObjectPropertyAssertion,DataPropertyAssertion, NegativeObjectPropertyAssertion,NegativeDataPropertyAssertion

  • 函数性的数据属性:FunctionalDataProperty

  • 键:HasKey

2.2实体

2.2.1类

基于子类关系,OMAHA医学本体将众多语义上具有包含与被包含的概念纵向聚合,形成了术语集架构中多个顶层类。 “七巧板”术语集共有17个顶层类(顶层概念),介绍如下:

临床所见:是指包括疾病和症状、体征在内的临床观察见到的相关状态,如发热、肺炎等。

操作:是为了改善个人或者人群健康,通过诊断或者改变疾病(或者健康状况)的进程所进行的医疗活动,如白内障囊膜切除术、尿常规检查、颅脑磁共振成像等。包括影像学诊断、临床诊断、一般临床检验、病理学诊断、临床非手术治疗、手术、临床物理治疗和康复治疗。

观察对象:是指针对临床所见的本质特征进行评估或观察的对象,如基础代谢率、肌张力等。

药品:是指用于预防、治疗、诊断人的疾病,有目的地调节人的生理机能并规定有适应症、用法和用量的物质,包括中成药、化学药品、生物药品和保健药品等,如阿司匹林、复方乙酰水杨酸、六味地黄丸等。

人体形态与结构:是指正常或异常的人体组织器官的位置、形态、结构、功能及其发展规律,如“股骨上韧带”、“平滑肌”。

物质:是指无生命的一般物质,包含化学物质、生物物质、中药材、食物、身体物质等,如米酒、移植物。

生物:是指活着的生命个体,包括植物、动物和微生物,如白桦、鱼、幽门螺旋杆菌等。

物理能量:是指所有用于医疗活动相关的物理能量,如电离辐射、电磁辐射、声波、光子束等。

物理实体:是指视觉或触觉可感知的物体,包括医疗器械、生活制品、交通工具和武器,如冷光仪、内窥镜、腹腔镜、油烟机、车等。

限定词:是指用于对概念进一步说明的修饰词语,包括发病和发病过程、入路、剂型、单位等,如急性、慢性、经颅、mg、片剂、空腹等。

标本:是指为了进行相应的物理、化学和生物学等检验而采集的患者的血液、排泄物、分泌物、呕吐物、体液和脱落细胞等样品,如痰标本、尿标本、血标本等。

事件:是指对人体造成某种损伤或疾病的事件,如车祸、坠落、摔倒等。

基因:是指线性排列在染色体上的携带有一定遗传信息,具有一定结构,并能进行自我信息复制与传递,控制生物个体性状表现的一段DNA或RNA序列,如TP53、RN5S1。

基因突变:是指细胞中的遗传基因发生的改变,包括单个碱基改变所引起的点突变,或多个碱基的缺失、重复和插入,如:NM_001134944.1(GHRL): c.116G>A (p.Arg39Gln)。

分子活性:是指基因产物在分子水平上的活性或功能,如TP53基因产物的分子活性是色氨酸5单加氧酶;AFP 甲胎蛋白的分子活性是铜离子结合、镍离子结合和金属离子结合。

生物过程:是指生物体通过遗传程序来实现的一种特定目标,通常由它们的结果或终止状态来描述,比如葡萄糖代谢、线粒体转运。

组织机构:表示人们为特定目的聚集而形成的团体,机构或场所,如企业、机关等。

2.2.2数据类型

OMAHA医学本体支持以下数据类型:

  • rdf:PlainLiteral
  • rdf:XMLLiteral
  • rdfs:Literal
  • owl:real
  • owl:rational
  • xsd:decimal
  • xsd:integer
  • xsd:nonNegativeInteger
  • xsd:string
  • xsd:normalizedString
  • xsd:token
  • xsd:Name
  • xsd:NCName
  • xsd:NMTOKEN
  • xsd:hexBinary
  • xsd:base64Binary
  • xsd:anyURI
  • xsd:dateTime
  • xsd:dateTimeStamp

2.2.3属性关系

OMAHA医学本体中的属性关系用来表示概念的特征,目前共有49条属性关系,用于描述以下6个核心顶层类:临床所见、操作、药品、基因、基因突变、人体形态与结构:

临床所见

  • 发生部位:表示一个临床所见在身体结构上的发生部位,如“肺炎”的发生部位是“肺部”,“红细胞增多症”的发生部位是“红细胞”。
  • 形态学改变:表示一个临床所见的特征在器官、组织或细胞水平上的形态学变化,如“心脏脓肿”的形态学改变是“脓肿”。
  • 临床过程:表示一个临床所见的发病(起病形式)和发病过程,如“慢性呼吸衰竭急性发作”的临床过程是“慢性病急性发作”。
  • 严重程度:表示一个临床所见的严重程度,如“婴儿期和青春期中度急性营养不良”的严重程度是“中度”。
  • 发生于...期间:表示一个临床所见或操作发生在某个生命周期时间段内或某个操作期间,如“新生儿黄疸”发生于“新生儿期”。
  • 后发于:表示一种操作后所见发生在某种操作之后,如“胃癌术后”后发于“手术”。
  • 评价对象:表示对一个临床所见进行评价时所指的其固有的本质含义,如“肌张力低下”评价对象是“肌张力”,“红细胞沉降率升高”评价对象是“红细胞沉降率测定”。
  • 评价结果:表示对一个临床所见进行评价后得到的结果,如“心脏指数降低”评价结果是“减少”。
  • 致病原因:表示一个临床所见的致病原因,如”缺铁性贫血”的致病原因是”缺铁”,”阿司匹林过敏”的致病原因是”阿司匹林”。
  • 病理过程:表示一个疾病中出现的共同存在的机能、代谢和结构变化的过程,如“感染性腹泻”的病理过程是“感染过程”。
  • 属性组:表示一个属性值对与其它一个或多个属性值对组成属性组,使得这个概念的定义更加清晰。

人体形态与结构

  • 方位:表示一个身体结构的方位信息,只适用于存在双侧对称的身体结构,如“左叶间支气管内腔”的方位是“左侧”。
  • 是…组成部分:表示身体结构和细胞结构内部的整体与部分关系,如“肝下缘”是“全肝膈面”的组成部分,“细胞浆内桥粒”是“细胞膜”的组成部分。
  • 是…的分支:表示动脉、静脉、神经、支气管等分支结构,如“坐骨神经动脉”是“臀下动脉”的分支。

操作

  • 发生于...期间:表示一个临床所见或操作发生在某个生命周期时间段内或某个操作期间,如“新生儿黄疸”发生于“新生儿期”。
  • 操作部位:表示一种操作所作用的身体部位,如“神经牵伸术”操作部位是“神经”。
  • 操作形态学改变:表示所描述的操作涉及到的形态学变化,如“膀胱外翻修补术”操作形态学改变是“外翻”。
  • 使用的器械: 表示被用来执行某种医疗操作时采用的设备或工具,且是此操作关注的重点设备,如“食管扩张术”使用的器械是“探条”。
  • 使用的通路器械:表示用来接近操作部位的设备或工具,如“腹腔镜下膀胱周围粘连松解术”使用的通路器械是“腹腔镜”。
  • 植介入器械:表示在医疗操作过程中关注的植入性、介入性医疗器械,如“全膝人工关节置换联合截骨术”的植介入医疗器械是“人工膝关节”。
  • 目标物质:表示操作过程关注的直接作用的物质或药物,如“肱骨移植术”目标物质是“骨移植物”,“角膜染色术”目标物质是“纹身染料”。
  • 辅助性物质:表示操作过程中用于辅助执行操作的相关物质,如“眼眶切开术伴有骨瓣”辅助性物质是“骨组织瓣”。
  • 入路:表示一个医疗操作的路径,如“腹腔镜多段大肠切除术”的入路是“经皮穿刺内窥镜下入路”。
  • 操作方法:表示为了完成某个操作所采取的动作,如“大肠-大肠吻合术”的操作方法是“吻合术”。
  • 使用技术:表示根据操作的目的,运用仪器、设备、装置等手段对人或检测标本进行检验、测量或观察获取结果所采用的技术手段,如“果糖测定-分光光度法”的使用技术是“分光光度法”。
  • 给药途径:表示药物和人体接触作用的途径,如“氧气雾化吸入”的给药途径是“吸入给药”。
  • 使用的能量:表示进行某项操作过程中使用的物理能量,如“用放射疗法的脉络膜视网膜病损破坏术”使用的能量是“辐射”。
  • 受检标本:表示为进行相应的化学、生物学和病理学等检验操作而采集的人体血液、尿液或组织等标本,如“24小时尿蛋白定量”的受检标本是“24小时标本”。
  • 受检成分:表示一项观测操作观察或测量的成分,如“1,25双羟维生素D测定”的受检成分是“维生素D”。
  • 精度类型:表示针对检测指标而言,定义检测指标是定量型、定性型等,如“24小时尿蛋白定量”的精度类型是“定量检测”。
  • 受检时长:表示得到观测结果所需要的时间,即一项检测指标究竟是片刻、瞬间或短时间的观测结果,还是在更长时间段内进行测量所获得的观测结果,如“24小时动态胃酸监测”的受检时长是“24小时”。
  • 指标:表示一种量纲类型,意指度量,是长短、大小、快慢、强弱等的度量,如质量浓度、酶活性(催化速率),如“肝素辅因子II活性测定”的指标是“活性”。
  • 操作条件:表示进行某项操作时需要遵循的特定条件,如“暗室俯卧试验”操作条件是“俯卧位”。
  • 属性组:表示一个属性值对与其它一个或多个属性值对组成属性组,使得这个概念的定义更加清晰。

药品

  • 给药途径:表示药物和人体接触作用的途径,如“补中益气丸(水丸)”的给药途径是“口服”。
  • 有效成分:表示药品中对生物体代谢或者化学反应起作用的成分,如“穿心莲片”的有效成分是“穿心莲”。
  • 剂型:表示药物的形态,如“葡萄糖注射液”的剂型是“注射液”、“氟氢可的松乳膏”的剂型是“乳膏”。
  • 分子规格单位:表示药品规格在分子上的单位,如“氯雷他定糖浆10mg/10ml”的分子规格单位是“mg”。
  • 分母规格单位:表示药品规格在分母上的单位,如“氯雷他定糖浆10mg/10ml”的分母规格单位是“ml”。
  • 规格成分:表示说明药品规格时针对的成分,如“注射用培美曲塞二钠 50mg(以培美曲塞计)”的规格成分是“培美曲塞”。
  • 生产厂家:表示生产药品的企业,如“拜阿司匹林”的生产厂家是“拜耳”。
  • 属性组:表示一个属性值对与其它一个或多个属性值对组成属性组,使得这个概念的定义更加清晰。

基因

  • 基因位点:表示基因在染色体上占有的特定位置,如“TP53”的基因位点是“17p13.1”。
  • 基因表达部位:表示基因表达控制着某个组织器官的形成,如“TP53BP1”的基因表达部位是“脑”、“心”、“肾”、“肌”、“胰”、“胎盘”。
  • 细胞定位:表示基因产物在细胞中的位置,如“AACS”的细胞定位是“胞浆”。
  • 分子活性:表示基因产物在分子水平上的活性或功能,如“TP53”的分子活性是“色氨酸5单加氧酶”。
  • 参与过程:表示基因产物参与的生物过程,如“TP53”的参与过程是“调控细胞内pH”。

基因突变

  • 突变核苷酸位点:表示突变核苷酸在染色体上的位置,如“NM_001134944.1(GHRL): c.116G>A (p.Arg39Gln)”的突变核苷酸位点是“Chromosome 3,10331519: 10331519”。
  • 所在基因组:表示突变核苷酸位置所在的基因组,如“NM_001134944.1(GHRL): c.116G>A (p.Arg39Gln)”所在基因组为“GRCh37”。
  • 突变基因:表示某基因突变涉及的相关基因,如“NM_001134944.1(GHRL): c.116G>A (p.Arg39Gln)”的突变基因是“GHRL”。
  • 转录本编码:表示基因通过转录形成的一种或多种可供编码蛋白质的成熟的mRNA,如“NM_001134944.1(GHRL): c.116G>A (p.Arg39Gln)”的转录本编码是“NM_001134944.1”。
  • 核苷酸改变:表示基因突变导致的核苷酸的改变,如“NM_001134944.1(GHRL): c.116G>A (p.Arg39Gln)”的核苷酸改变是“c.116G>A ”
  • 氨基酸改变:表示基因突变导致的氨基酸的改变,如“NM_001134944.1(GHRL): c.116G>A (p.Arg39Gln)”的氨基酸改变是“p.Arg39Gln”。
  • 属性组:表示一个属性值对与其它一个或多个属性值对组成属性组,使得这个概念的定义更加清晰。

2.2.3.1对象属性

“七巧板”术语集共有49条对象属性,满足如下公理:

对象属性名称

带或不带属性链的对象属性的包含

传递的对象属性

发生部位


形态学改变


临床过程


严重程度


发生于...期间


后发于


评价对象


评价结果


致病原因


病理过程


方位


是…组成部分


是...的分支

操作部位


操作形态学改变


使用的器械


使用的通路器械

使用的器械

植介入器械


目标物质


辅助性物质


入路


操作方法


给药途径


使用的能量


使用技术


受检标本


受检成分


精度类型


受检时长


指标


操作条件


有效成分


剂型


分子规格单位


分母规格单位


规格成分


生产厂家


基因表达部位


细胞定位


分子活性


参与过程


基因位点


突变基因


突变核苷酸位点


所在基因组


转录本编码


核苷酸改变


氨基酸改变


属性组



对每一条对象属性的属性组使用规则进行了限制,如:

属性关系

关系值出现的次数

关系组数量

关系组内数量

关系组外数量

关系值的数量

是...组成部分

0..*

0..0

0..0

0..*

0..*

发生于...期间

0..*

0..*

0..1

0..*

0..*

后发于

0..1

0.. *

0..1

0..1

0..*

氨基酸改变

0..*

0..*

0..1

0..0

0..1

核苷酸改变

0..*

0..*

0..1

0..0

0..1

突变核苷酸位点

0..*

0..*

0..*

0..0

0..*

转录本编码

0..*

0..*

0..1

0..0

0..1

对对象属性的域和值进行了相应的约束,如:

对象属性名称

对象属性的域约束

对象属性的值约束

发生部位

临床所见

解剖实体

形态学改变

临床所见

异常形态结构

临床过程

临床所见

时间状态

严重程度

临床所见

严重程度

发生于...期间

临床所见、操作

时间状态、操作

2.2.4注释属性

OMAHA医学本体使用下列注释属性:

2.2.4.1语义标签

OMAHA医学本体共有42种语义标签,语义标签间的关系详见官网“语义类型关系图”。

顶层类的语义标签介绍如下:

顶层类(首选术语)

顶层类语义标签

临床所见

临床所见

操作

操作

组织机构

组织机构

药品

药品

物质

物质

分子活性

分子活性

生物过程

生物过程

基因突变

基因突变

基因

基因

人体形态与结构

人体形态与结构

生物

生物

限定词

限定词

物理实体

物理实体

标本

标本

事件

事件

观察对象

观察对象

物理能量

物理能量

部分语义标签下存在子类语义标签,子类关系如下:

子代语义标签

关系类型

父代语义标签

疾病

子类

临床所见

观测操作

子类

操作

异常形态结构

子类

人体形态与结构

医疗器械

子类

物理实体

单位

子类

限定词

剂型

子类

限定词

给药途径

子类

限定词

时间状态

子类

限定词

空间关系

子类

限定词

操作方法

子类

限定词

精度类型

子类

限定词

量纲类型

子类

限定词

技术

子类

限定词

严重程度

子类

限定词

评价结果

子类

限定词

病理过程

子类

限定词

核苷酸位点

子类

限定词

基因组

子类

限定词

转录本编码

子类

限定词

核苷酸改变

子类

限定词

氨基酸改变

子类

限定词

基因位点

子类

限定词

身体状态

子类

限定词

体位

子类

限定词

2.2.4.2首选术语

最推荐用来表达某一概念的术语,每个概念只有一个首选术语。首选术语的指定需要遵守相应的规则:

  • 除特殊类外,确定术语类型时一般参考全国科学技术名词审定委员会审定颁布的医学名词,《中文医学主题词表》,《中医药学主题词表》三个标准。优先级全国科学技术名词审定委员会审定颁布的医学名词(术语在线)>《中文医学主题词表》=《中医药学主题词表》。
  • 药品顶层类下的术语参考来源及顺序为:《中国药典2015年版》>全国科学技术名词审定委员会审定颁布的医学名词(术语在线)>《中文医学主题词表》=《中医药学主题词表》。
  • 基因顶层类下的术语参考来源和顺序为:HGNC(人类基因命名委员会)>Entrez Gene,又根据中国实际研究和使用基因名称时,通常使用的是基因符号,所以基因的首选术语为以上来源中出现的基因符号。
  • 基因突变顶层类、氨基酸改变类和核苷酸改变类下的术语参考来源为:HGVS(人类基因组变异学会)
  • 转录本编码类下的术语参考来源为:RefSeq参考序列数据库。

2.2.4.3待定首选术语

最推荐用来表达某一概念的术语,但是没有在全国科学技术名词审定委员会审定颁布的医学名词、《医学主题词表》、《中医药学主题词表》中出现。首选术语和待定首选术语不会同时存在。

2.2.4.4许用术语

许用术语是某一概念的诸术语中,首选术语/待定首选术语以外的同义词。

2.5命名个体

OMAHA医学本体只允许命名个体存在,即经过明确声明属于某个类的个体。

3.表达式

OMAHA医学本体采用OWL2 EL函数式语法(Functional-Style syntax)定义表达式。该语法适用于定义规范和推理机推理。


[1]https://www.w3.org/TR/owl2-profiles/#OWL_2_EL

  • No labels