Skip to end of metadata
Go to start of metadata

下文中的规范仅节选了“汇知”医学知识图谱编辑指南(内部使用)——实体表示规范中可以帮助使用者更好地使用图谱的部分内容。

UTF-8编码占4个字节的字符


UTF-8编码中占4个字节的字符无法导入最多支持3个字节编码集的数据库。为了方便企业在各类数据库中使用该类字符,OMAHA发布了拆分后的字符,同时列出拆分前后对应表。目前“汇知”医学知识图谱中已拆分字符的对应关系见下表。


UTF-8编码占4个字节的字符

拆分后的字符

image2022-6-30_17-35-17.png

(牙合)

image2022-6-30_17-36-12.png

(足母)


实体示例:

上标和下标规范


为了实体上标和下标表示更加规范和完整,“汇知”医学知识图谱借鉴了HTML中上标和下标标签的表示形式,具体表示形式见下方说明:

  • 上标表示形式:<sup>上标文本</sup>;
  • 下标表示形式:<sub>下标文本</sub>。


实体示例:

上标示例:“氢离子H+”写为“氢离子H<sup>+</sup>”;

下标示例:“二氧化碳CO2”写为“二氧化碳CO<sub>2</sub>”。





  • No labels