当前位置：首页 > news >正文

谷歌开源医疗领域AI语言模型速递：medgemma-27b-text-it

news 2025/10/30 20:37:03

一、模型概述

MedGemma 是由谷歌开发的一个医疗领域 AI 模型系列，基于 Gemma 3 架构，旨在加速医疗保健相关 AI 应用的开发。该模型系列包含两个主要变体：4B 多模态版本（支持文本和图像理解）以及 27B 纯文本版本（专为推理计算优化且仅提供指令微调模型）。MedGemma 27B 仅在医学文本上进行训练，适合需要处理医疗文本任务的场景。

二、模型使用方法

文档提供了两种主要的模型调用方式：通过 pipeline API 快速运行模型以及直接加载模型进行更灵活的操作。

（1）通过 pipeline API 调用

需要先安装 transformers 库（版本 4.50.0 及以上），然后使用以下代码：

from transformers import pipeline
import torch
pipe = pipeline("text-generation",model="google/medgemma-27b-text-it",torch_dtype=torch.bfloat16,device="cuda",
)
messages = [{"role": "system","content": "You are a helpful medical assistant."},{"role": "user","content": "How do you differentiate bacterial from viral pneumonia?"}
]
output = pipe(text=messages, max_new_tokens=200)
print(output[0]["generated_text"][-1]["content"])

（2）直接加载模型

除了 pipeline API，还可以直接加载模型和分词器进行更复杂的操作，代码如下：

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
model_id = "google/medgemma-27b-text-it"
model = AutoModelForCausalLM.from_pretrained(model_id,torch_dtype=torch.bfloat16,device_map="auto",
)
tokenizer = AutoTokenizer.from_pretrained(model_id)
messages = [{"role": "system","content": "You are a helpful medical assistant."},{"role": "user","content": "How do you differentiate bacterial from viral pneumonia?"}
]
inputs = tokenizer.apply_chat_template(messages,add_generation_prompt=True,tokenize=True,return_dict=True,return_tensors="pt",
).to(model.device)
input_len = inputs["input_ids"].shape[-1]
with torch.inference_mode():generation = model.generate(**inputs, max_new_tokens=200, do_sample=False)generation = generation[0][input_len:]
decoded = tokenizer.decode(generation, skip_special_tokens=True)
print(decoded)

三、模型架构与技术规格

MedGemma 基于 Gemma 3 的纯解码器 Transformer 架构，具有以下特点：

模态能力：4B 版本支持文本和视觉模态，27B 版本仅支持文本
注意力机制：采用分组查询注意力（Grouped-Query Attention，GQA）
上下文长度：支持至少 128K tokens 的长上下文
训练框架：使用 JAX 进行训练，可充分利用 TPU 等硬件加速

四、性能与验证

MedGemma 在多个医学相关的基准测试中表现出色，以下为部分关键性能指标：

指标	MedGemma 27B	Gemma 27B	MedGemma 4B	Gemma 4B
MedQA (4-shot)	89.8	74.9	64.4	50.7
MedMCQA	74.2	62.6	55.7	45.4
PubMedQA	76.8	73.4	73.4	68.4
MMLU Med (text-only)	87.0	83.3	70.0	67.2
MedXpertQA (text-only)	26.7	15.7	14.2	11.6
AfriMed-QA	84.0	72.0	52.0	48.0