当前位置：首页 > news >正文

ollama使用gpu运行大模型

news 2025/10/31 5:53:14

罗列ollma镜像

ollama list

拉取ollama镜像源里面的模型：

ollama pull qwen2:1.5b

下载CudaToolkit
https://developer.nvidia.com/cuda-toolkit-archive
我这里选择11.7的万金油版本，从来没出过bug
在这里插入图片描述

Ollama安装好后，为了让推理跑在GPU上，可以按照如下步骤设置环境变量：
在“系统变量”中，点击“新建”按钮。
添加以下环境变量：
变量名：OLLAMA_GPU_LAYER
变量值：cuda
在这里插入图片描述
验证是否使用gpu
问几个比较复杂的问题然后再另外一个命令行窗口输入命令

ollama ps

窗口1
在这里插入图片描述
窗口2

可以看见，我们使用到了gpu，并且很神速

或者看一下任务管理器的gpu运行情况也行，如果利用率很高说明用到了gpu

【Java学习方法】类变量

STM32单片机GUI系统1 GUI基本内容

六台升降台完整的限位保护逻辑

Manus与DeepSeek 的区别

Swagger在java的运用

Java基础 Day17

Linux中的文件介绍

C++ 常见知识积累

Temporary failure in name resolution

DVWA-XSS

PT5F2307触摸A/D型8-Bit MCU

RESTful API设计：从原则到Gin实现

Rust 学习笔记：泛型

从电商角度设计大模型的 Prompt

Baklib知识中台驱动智能服务创新

AtCoder 第406场初级竞赛 A~E题解