当前位置: 首页 > news >正文

可下载或通过爬虫获取疾病相关数据的网站及平台,涵盖临床数据、基因关联、药品信息等方向,并附注数据特点与获取方式:(不公开)

一、综合性疾病数据库

  1. MalaCards

    • 数据内容:集成21,787种疾病的症状、基因、药物、临床试验等信息,支持罕见病和复杂疾病查询 。
    • 获取方式
      • 直接访问官网 https://www.malacards.org 手动下载;
      • 通过Python爬虫解析本地保存的HTML页面(需点击“Show All”获取完整数据) 。
    • 注意:需处理反爬机制,建议下载本地页面后解析。
  2. GeneCards Suite

    • 关联数据库:包含GeneCards(基因功能)、MalaCards(疾病)、PathCards(调控网络)等,提供疾病与基因的关联分析 。
    • 适用场景:研究疾病遗传机制或药物靶点。

二、医学影像与临床数据集

  1. 医学影像数据集集锦(GitHub)

    • 数据内容:收录80+个公开医学影像数据集,涵盖肝脏、肺部等器官的CT/MRI数据,标注类型包括分割、分类等。
    • 获取方式
      • 通过GitHub项目 linhandev/dataset 查看列表;
      • 部分数据集提供Aistudio不限速下载链接(如LiTS、Sliver07)。
  2. 国家人口健康科学数据中心

    • 数据内容:汇交人口健康领域的科学数据,包括疾病调查、临床记录等 。
    • 获取方式:需通过官网 https://www.ncmi.cn 提交数据汇交申请或查询公开数据集。

三、药品与疾病关联数据

  1. 丁香园医疗数据开放平台

    • 数据内容:提供药品说明书、疾病科普、医院信息等结构化数据,覆盖210万+医生用户画像 。
    • 适用场景:药品研发或医保核赔等商业分析。
    • 接口服务:支持通过API获取数据(需注册开发者账号) 。
  2. 无码科技药品数据库

    • 数据内容:收录17万+药品详细信息,包括适应症、禁忌、药理毒理等。
    • 获取方式:通过API查询(如“盐酸二甲双胍片”的完整说明书)。

四、健康医疗大数据平台

  1. 浪潮健康医疗大数据平台(HDSP 2.0)

    • 数据内容:整合区域医疗数据,支持疾病分布、资源分配等分析,适用于公共卫生研究。
    • 获取限制:需与平台合作(如政府或医疗机构)申请数据权限。
  2. 北京大学健康医疗大数据平台

    • 数据内容:包含多源异构临床数据(如NCIS医疗质量数据),支持高性能计算分析 。
    • 适用场景:学术研究需通过伦理审查并申请访问 。

五、其他工具与注意事项

  • 爬虫技术建议
    • 针对反爬网站(如GeneCards),可优先下载本地页面再解析 ;
    • 使用Python库(如BeautifulSoup)提取HTML中的表格数据 。
  • 合规性
    • 遵循《人类遗传资源管理条例》等法规,避免敏感数据滥用 ;
    • 商业用途需获得平台授权(如丁香园API) 。

 


文章转载自:
http://bibliokleptomania.hyyxsc.cn
http://cameralism.hyyxsc.cn
http://aquarii.hyyxsc.cn
http://accelerant.hyyxsc.cn
http://brute.hyyxsc.cn
http://alcayde.hyyxsc.cn
http://borate.hyyxsc.cn
http://aberration.hyyxsc.cn
http://annunciator.hyyxsc.cn
http://benison.hyyxsc.cn
http://archerfish.hyyxsc.cn
http://agrimotor.hyyxsc.cn
http://asperse.hyyxsc.cn
http://bacchus.hyyxsc.cn
http://brinkman.hyyxsc.cn
http://beluga.hyyxsc.cn
http://adularia.hyyxsc.cn
http://bagatelle.hyyxsc.cn
http://booter.hyyxsc.cn
http://biogeocenosis.hyyxsc.cn
http://brigandine.hyyxsc.cn
http://campfire.hyyxsc.cn
http://abreaction.hyyxsc.cn
http://bombsite.hyyxsc.cn
http://ax.hyyxsc.cn
http://abyssalpelagic.hyyxsc.cn
http://bathochrome.hyyxsc.cn
http://carse.hyyxsc.cn
http://cayenne.hyyxsc.cn
http://autosave.hyyxsc.cn
http://www.dtcms.com/a/281324.html

相关文章:

  • PHP安全漏洞深度解析:文件包含与SSRF攻击的攻防实战
  • keeplived双击热备配置
  • chrome浏览器(chrome138.0.0.0 )无法安装扩展程序,因为它使用了不受支持的清单版本解决方案
  • GAMES101 lec2-数学基础1(线性代数)
  • 03 51单片机之独立按键控制LED状态
  • HCIA第三次综合实验:VLAN
  • 连接new服务器注意事项
  • Java核心类库深度解析与实战:从字符串处理到计算器开发
  • 外网如何连接内网中的mysql数据库服务?跨网直接访问操作,不用公网IP
  • 人机协作系列(四)AI编程的下一个范式革命——看Factory AI如何重构软件工程?
  • 力扣——1071. 字符串的最大公因子
  • 解密AWS VPC路由表:显式关联与隐式关联,谁决定了网络出口?
  • 深入剖析Java并发基石:AQS原理与实战
  • java 并发面试题2
  • 【Java篇】IntelliJ IDEA 安装与基础配置指南
  • Linux操作系统从入门到实战(十)Linux开发工具(下)make/Makefile的推导过程与扩展语法
  • 大模型在1型糖尿病肾病V期预测及治疗方案制定中的应用研究
  • 快速了解 HTTPS
  • MyBatis Plus功能增强全解析:从手写SQL到优雅开发的进阶指南
  • 16、鸿蒙Harmony Next开发:组件扩展
  • KeilMDK5如何生成.bin文件
  • 项目进度跨地域团队协作困难,如何统一进度安排
  • PHP语法高级篇(三):Cookie与会话
  • Redis中的红锁
  • ADC采集、缓存
  • Axios 完整功能介绍和完整示例演示
  • 映美打印机-URL页面打印
  • Spring MVC 执行流程详解:一次请求经历了什么?
  • 微信小程序:在ios中border边框显示不全
  • XCTF-repeater三链破盾:PIE泄露+ROP桥接+Shellcode执行的艺术