当前位置: 首页 > news >正文

UMLS数据下载及访问

UMLS数据申请

这个直接在官网上申请即可,记得把地址填全,基本都会拿到lisence。

UMLS数据访问

UMLS的数据访问分为网页访问,API访问以及数据下载后的本地访问,网页访问,API访问按照官网的指示即可,这里主要讲一下本地访问的注意事项。

UMLS 本地访问

本地访问是指可以下载数据文件并在本地数据库例如mysql里查看及处理。UMLS提供的可下载数据文件主要分为三类,第一类是UMLS Metathesaurus Precomputed Subsets ,只有元数据库的数据;第二类是Full UMLS Release Files包含了元数据库,语义网络以及专业术语;第三类是Metathesaurus History Files主要是历史的元数据。

UMLS Metathesaurus Precomputed Subsets数据导入

  • step1: 找到安装文件。在.\umls-2024AB-metathesaurus-full\2024AB\META 路径下,找到populate_mysql_db.bat(根据数据库和系统型号选择合适的安装文件即可。e.g. 对于mysql,Windows安装选populate_mysql_db.bat, linux 安装选populate_mysql_db.sh)
  • step2:修改自定义内容。使用windows自带的Nodepad打开populate_mysql_db.bat,将如下信息配置成自己的个性化信息。
    set MYSQL_HOME=<path to MYSQL_HOME>
    set user=<username>
    set password=<password>
    set db_name=<db_name>
    
  • step3:安装,看log解决其他报错。

Full UMLS Release Files数据导入

这个比上个部分(metathesaurus precomputed subsets部分的步骤多了一步将mmsys解压并自定义subset的过程,后续向mysql的导入操作与上个部分一致)

mmsys解压并自定义subset:UMLS - MetamorphoSys Help

(mysql安装教程可参考reference2)

可能出现的bug

1. 要注意一下metathesaurus precomputed subsets这个版本的mysql_tables.sql会报MySQL ERROR 1064 (42000)的错误,需要修改一下load data的语句。

原始sql:

load data local infile 'MRCONSO.RRF' 
into table MRCONSO 
fields terminated by '|' 
ESCAPED BY '' 
lines terminated by @LINE_TERMINATION@

修改建议:

将 @LINE_TERMINATION@ 替换为有效字符串

  • '\n' (Unix/Linux)
  • '\r\n' (Windows)

2. 如果提前已经在环境变量中配置好mysql的路径,则populate_mysql_db.bat需要修改一下。将命令行语句的%MYSQL_HOME%\bin\mysql直接修改为mysql即可。

REFERENCE

UMLS - Load Scripts

Windows 安装并配置 MySQL 5.6_mysql 5.6 安装-CSDN博客

相关文章:

  • 使用 Python 将爬取的内容保存到 Excel 表格
  • DeepSeek的100个应用场景
  • 长文档处理痛点:GPT-4 Turbo引文提取优化策略与替代方案讨论
  • express + vue 部署宝塔
  • 从月牙定理看古希腊数学的奇妙突破
  • 【Python学习 / 6】面向对象编程(OOP)
  • C++中变量与容器的默认初始化:0的奥秘
  • URL解码(unquote)判断与操作教程
  • 1、Window Android 13模拟器 将编译的映像文件导入Android Studio
  • python如何从路径中获取文件名
  • Helm快速开始
  • Ubuntu 下 nginx-1.24.0 源码分析 - ngx_pnalloc函数
  • vue3-03初学vue3中的配置项setup(Composition API (组合API组件中所用到的:数据、方法等,均要配置在setup中)
  • 2013年下半年软件设计师上午题考察知识点及其详细解释(附真题及答案解析)
  • 探秘 DeepSeek R1 模型:跨越多领域的科技奇迹,引领智能应用新浪潮
  • springmvc(13/158)
  • 股票交易之多策略协调规划
  • 文件操作(PHP)(小迪网络安全笔记~
  • Win10系统Docker+DeepSeek+ragflow搭建本地知识库
  • JavaScript(JS)
  • 黄土是他们的气质:打破宁夏当代油画创作的沉寂
  • 《瞭望》周刊社原总编辑、党委书记姬斌逝世,享年67岁
  • 中美经贸高层会谈将在午餐后继续
  • 巴称巴控克什米尔地区11人在印方夜间炮击中身亡
  • 云南多地突查公职人员违规饮酒:公安局门口开展酒精吹气测试
  • 夜读丨喜马拉雅山的背夫