当前位置: 首页 > news >正文

AI医生时代来临!o1模型在医疗诊断中超越人类医生

Hinton梦想的AI医生要来了!斯坦福哈佛实测:o1以78%正确率超人类

在医疗领域,人工智能(AI)正在前所未有地影响传统医疗实践,OpenAI推出的o1-preview模型就是其中的佼佼者。近期,哈佛大学和斯坦福大学的研究团队对o1进行了深入测试,结果表明,其在医疗推理和诊断任务中的表现超过了人类医生,准确率高达78%。这一突破预示着AI在医疗诊断领域的广泛应用即将到来。

AI

研究背景

在这项研究中,科学家们评估了o1-preview与数百名医生的诊断能力比较。他们使用了《新英格兰医学杂志》(NEJM)的临床病例以及真实的急诊室场景,通过随机抽取患者的方式进行实验。这项研究不仅关注于o1模型的准确性,还探讨了AI在医疗推理中的潜力,以及如何与人类医生的经验相结合。

research

实验结果

经过盲评的实验结果令人振奋,o1-preview在诊断准确率和推理能力方面都表现突出。

  • 临床案例评估:研究团队对143个病例进行了分析,o1-preview的诊断质量与两位医生的表现高度一致,达到84%。在所有实验中,o1模型以78.3%的比例将正确诊断包含在其待选清单中。

  • 第一诊断一击即中:在o1-preview提供的第一个诊断中,52%病例直接命中。

  • 跟踪表现:无论是数据截止点之前还是之后,o1-preview的表现相对稳定:截止点前的准确率为79.8%,截止点后为73.5%。在与之前使用的GPT-4的比较中,o1-preview在88.6%的病例中展现了完全正确或非常接近的诊断结果,而GPT-4的相应比例为72.9%。

  • 检查能力评价:在选择下一步诊断检查方面,o1-preview在87.5%的病例中选择了正确的检查方案,11%的病例被医生认为“有帮助”,仅1.5%的病例被视为“无帮助”。

results

推理表现

在NEJM Healer课程中进行的临床推理评估显示,o1-preview在80个病例中获得了78份R-IDEA的满分,明显超越了GPT-4及主治医生的表现。此外,o1-preview的中位覆盖率达到了0.92,与其他医生相比并没有显著差异。在处理灰色事项管理、标志性诊断及诊断概率推理案例中,o1-preview都表现得更为出色。

diagnosis

急诊案例表现

在比较o1与GPT-4以及两位主治医生的急诊诊断能力时,o1的表现始终优于他们。特别是在急诊室的初步分诊阶段,这是一个要求对患者信息进行快速判断的环节。o1在这个阶段的正确诊断率为65.8%,而医生的诊断率在54.4%到60.8%之间。随着信息的增加,所有诊断能力都得到了提升,但o1的优势始终明显。

performance

专家观点

在研究的结尾,沃顿教授Ethan Mollick指出,医生应当积极使用AI来获取第二诊断意见,尽管最终的决定仍然在于医生个人,但不使用AI就如同放弃了一个能显著改善病人护理的重要工具。

医学博士Liam McCoy也指出,AI尤其适合执行鉴别诊断任务,这类任务需要高强度的联想能力,而不是单纯的推理能力。o1-preview的成功应用将为未来的医疗诊断流程带来革命性变革。

emergency

未来展望

随着AI技术的不断进步,o1-preview的成功不仅对医疗行业产生了直接影响,也为AI在其他行业的应用提供了经验借鉴。我们可以预见,AI将成为医生的重要助手,提升医疗服务的质量和效率。

opinions

AI医生的梦想正在逐步变为现实,但这场变革的核心在于如何将人类医生的经验与AI的精准结合,形成更强大的医疗系统。使用AI的医生将能够提供更加精准的医疗服务,提高诊断速度和准确性,最终将患者的医疗体验推向新的高度。

future

对于未来的医疗界来说,拥抱这一智能革命,将是提升服务水平、降低误诊率和改善患者成果的关键一步。随着更多实验与应用的展开,AI医生的时代已经在不远处等我们。

http://www.dtcms.com/a/239363.html

相关文章:

  • Springboot 基于MessageSource配置国际化
  • 玄机——某次行业攻防应急响应(带镜像)
  • 力扣-131.分割回文串
  • 72常用控件_QGridLayout的使用
  • 一个自动反汇编脚本
  • 大数据(3) 分布式文件系统HDFS
  • LLMs 系列科普文(15)
  • 第13次01:广告及商品数据呈现
  • MS8312A 车规 精密、低噪、CMOS、轨到轨输入输出运算放大器,用于传感器、条形扫描器
  • 2025-06-08 思考-人被基因和社会关系双重制约
  • 打卡day48
  • FlexRay总线
  • DAY 45 Tensorboard使用介绍
  • MATLAB R2025a|Win中文|仿真建模|安装教程
  • Java中线程的常用方法
  • 批量修改文件夹名 修改文件夹名
  • Python初体验学习笔记
  • 深入解析机器学习的心脏:损失函数及其背后的奥秘
  • 第11篇:数据库中间件系统可配置化设计与动态规则加载机制
  • leetcode.多数元素
  • C语言中的文件操作
  • 【文件传输脚本】
  • Linux 内核内存管理子系统全面解析与体系构建
  • 2025-06-02-数据库的分类和应用
  • (三十四)Android图片列表与点击弹窗展示大图完整教程
  • 磁盘空间清道夫FolderSize 系列:可视化分析 + 重复文件识别,
  • 百度首页布局:固定右侧盒子不随界面缩小掉下去
  • (二)原型模式
  • python训练营打卡第48天
  • Python Web项目打包(Wheel)与服务器部署全流程