当前位置：首页 > news >正文

使用Optimum-habana对LLM模型训练推理

news 2025/9/27 10:50:56

optimum-habana 是 Transformers 和 Diffusers 库与 Intel Gaudi AI 加速器（HPU）之间的接口。它提供了一套工具，可轻松在单 HPU 和多 HPU 环境下针对不同下游任务进行模型加载、训练和推理。用户只需稍作修改，就可以在 Intel Gaudi 加速器上尝试数千个 Hugging Face 模型和相关任务。

1、官方已验证的模型和任务列表：

Transformers:

Architecture	Training	Inference	Tasks
BERT	✔️	✔️	text classificationquestion answeringlanguage modelingtext feature extraction
RoBERTa	✔️	✔️	question answeringlanguage modeling
ALBERT	✔️	✔️	question answeringlanguage modeling
DistilBERT	✔️	✔️	question answeringlanguage modeling
GPT2	✔️	✔️	language modelingtext generation
BLOOM(Z)		DeepSpeed	text generation
StarCoder / StarCoder2	✔️	Single-card	language modelingtext generation
GPT-J	DeepSpeed	Single cardDeepSpeed	language modelingtext generation
GPT-Neo		Single card	text generation
GPT-NeoX	DeepSpeed	DeepSpeed	language modelingtext generation
OPT		DeepSpeed	text generation
Llama 2 / CodeLlama / Llama 3 / Llama Guard / Granite	✔️	✔️	language modelingtext generationquestion answeringtext classification (Llama Guard)
StableLM		Single card	text generation
Falcon	LoRA	✔️	language modelingtext generation
CodeGen		Single card	text generation
MPT		Single card

http://www.dtcms.com/a/411468.html

相关文章：

提升RAG知识库质量，文档解析如何解决上下文丢失与结构错误问题？

两个表格（Excel/CSV）字段不完全一致，要合并在一起

图书网站建设一般纳税人企业所得税

基于Python的二手车价格数据分析与预测系统的设计与实现

网站建设是什么科目免费app网站下载大全

API协作云：从OpenAPI到MCP跨语言的接口对接实践

网站建设辶金手指排名十二cms系统设计方案

k8s集群部署nacos集群

成都前几年网站建设公司小红书怎么做关键词排名优化

设计网站报价企业网络推广方案策划书

做内容网站好累网泰网站建设网络推广

自己做网站app信阳企业网站开发

软件详细测评一：百宝音配音平台

建站所有步骤国际新闻最新消息今天新闻大事件视频

网站的互动功能seo的中文意思

辽宁省精神文明建设工作三大创建活动网站培训班线上优化

Docker 快速部署 Dify + 应用构建完整流程

矩形碰撞检测

队列+宽搜(BFS)-103.二叉树的锯齿形层序遍历-力扣(LeetCode)

使用Eigen矩阵库，计算Ax = B (m＞n)矩阵的方法

MIT 6.S081 文件系统的基本结构（Lab10：File system）

跨境电商建站公司北京建设安全网络平台87

【读书笔记】深入理解JVM C1~3

Spring Boot携手Leaflet，点亮省级旅游口号WebGIS可视化之路

第一次备考怎么记笔记？三步模板直接用

网站建设基础筹备宁河做网站公司

中小型网站建设与管理总结免费h5生成网站

有哪些做的好的汽配零配件网站代理网站哪个好

2025GUI项目实践：Unity编辑模式下GUI运行

C语言：10行杨辉三角形