当前位置：首页 > news >正文

笔记本电脑本地部署ollama大模型（显存不足调用CUDA Unified Memory方法）

news 2025/10/16 3:15:37

软硬件：win11,NVIDIA GeForce RTX 3050 显存4g

一.ollama模型最低要求

1. Llama 3.1 (8B) 模型

GPU: 至少需要 1 张具有 16 GB 显存的 GPU（例如 NVIDIA Tesla V100 或 A100）。
CPU: 高性能的多核处理器（例如 Intel Xeon 或 AMD Ryzen）。
内存: 最少 32 GB 的系统内存。
存储: 需要大约 4.7 GB 的存储空间用于模型文件。

2. Llama 3.1 (70B) 模型

GPU: 至少需要 4 张具有 40 GB 或更高显存的 GPU（例如 NVIDIA A100 或 H100）。可以采用分布式计算方式来处理。
CPU: 高性能的多核处理器（例如 Intel Xeon 或 AMD EPYC），推荐使用多台服务器。
内存: 至少 256 GB 的系统内存。
存储: 需要大约 96 GB 的存储空间用于模型文件，建议使用高速 SSD。

3. Llama 3.1 (405B) 模型

GPU: 需要大规模的 GPU 集群，通常包括数十张具有 80 GB 或更多显存的 GPU（例如 NVIDIA A100 或 H100）。需要专门的硬件配置和高性能计算设施。
CPU: 高性能的多核处理器（例如 Intel Xeon 或 AMD EPYC），并且需要多个处理节点来支持分布式计算。
内存: 至少 1 TB 或更多的系统内存。
存储: 需要几百 GB 到 TB 级别的存储空间，建议使用高速 SSD 或分布式存储系统。

对于我们普通人的电脑，ollama模型的部署，你至少拥有一张有显存的n系显卡，再者就是电脑内存一定要在16g及以上

我的硬件信息，有两张8g的内存，一张英伟达显存为4g的3050显卡

查看内存信息：wmic memorychip get capacity, devicelocator, manufacturer, memorytype, speed
查看GPU的信息：nvidia-smi

二.cuda和cudnn的安装(解决显存不足的办法）

CUDA Unified Memory: CUDA 提供了统一内存（Unified Memory），允许 GPU 和 CPU 共享内存空间。这可以使得内存需求超出 GPU 显存时，数据可以存储在主机内存中并在需要时传输到 GPU。

1.cuda的选择与安装

1.打开NVIDIA控制面板>>>系统信息>>>组件

就这个：

可以看到我的是nvduda64.dll NVIDIA cuda 12.6.41 driver

2.进官网，选择相应的cuda,选择版本应该=<自己的版本NVIDIA cuda 12.6.41 driver：CUDA Toolkit Archive | NVIDIA Developer

3.选择本地exe安装

4.双击安装包，自定义设置，勾选组件：

继续点下一步

点击关闭，安装结束

验证：cmd输入

最高版本：nvidia-smi
当前版本：nvcc --version

结果：

2.cudnn的安装
网址：https://developer.nvidia.com/cudnn-downloads?target_os=Windows

多版本：cuDNN Archive | NVIDIA Developer

下载的是一个压缩包，解压至你想保存的位置，并将解压的目录中的bin目录添加到环境变量里的系统变量path里面

这是我解压的bin文件夹位置：

D:\app\cudnn\bin

验证是否成功：

找到你的这个目录，并将下面的变量添加到环境变量里的系统变量path里面

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\extras\demo_suite

打开cmd，分别输入

bandwidthTest.exe 
和
deviceQuery.exe

结果：

三.安装ollama

官网：Ollama

双击安装，默认会安到c盘，好像也没法改,但是看了一下也不是很大，大的是模型，待会会说怎么改模型的存储位置，install，等安装完：

它会自动启动

打开cmd,不用配置path啥的，输入下面两个代码看一下结果：

ollama

ollama list

OK啦

四.模型的选择和默认模型存储位置的更改

ollama官方提供的模型：llama3.1

小黄脸hugging face的模型（模型社区），有别人训练好的模型：https://huggingface.co/

模型的选择

1.更改模型下载位置

创建一个想要你想要保存模型的位置

添加系统环境变量

变量名：OLLAMA_MODELS

变量值：D:\app\OLLAMA_MODELS

2.ollama的模型下载

8b模型是我们目前能运行的最大模型

复制指令，cmd中输入，等下载完

上一步设置无误的话，下载文件会有在你的模型存储位置会有两个这样的文件

下载完后，它自己会启动，试着对话一下，还是很顺畅的

查看全文

http://www.dtcms.com/a/48657.html

AI应用开发 4 - Langchain应用开发

JavaWeb后端基础（6）

【网络编程】之TCP实现客户端远程控制服务器端及断线重连

软考高级信息系统项目管理师笔记-第4章信息系统管理

【一些技术成长的思考】

高频Postman接口测试面试题

pytorch-gpu版本安装(英伟达gpu驱动安装)

VSCode知名主题带毒安装量900万次

Mapmost SDK for WebGL 全新升级——解锁 3DGS 新能力！

ThinkPHP使用phpword读取模板word文件并添加表格

SparkSQL全之RDD、DF、DS ,UDF、架构、资源划分、sql执行计划、调优......

开放鸿蒙OpenHarmony 5.0.0 Release 兼容性测试实战经验分享

【Vue.js 中的生命周期钩子有哪些？】

探秘基带算法：从原理到5G时代的通信变革【四】Polar 编解码（一）

批量提取 Word 文档中的图片

vite创建vue项目

【GraphQL API 漏洞简介】

蓝桥杯 2022 Java 研究生省赛 3 题质因数个数

深度学习transfomer架构的职业匹配系统

完全背包变体-排列和组合的循环顺序问题

【Linux学习笔记】Linux基本指令及其发展史分析

C++（三）类与对象中

Spring MVC 处理请求

MRI学习笔记-Meta分析

Eureka Server 数据同步原理解析

NodeJS服务器 + Vue3框架从搭建服务器定义接口到请求数据页面展示

【杂谈】-Meta AI的可扩展内存层

养老小程序方案详解居家养老小程序系统

第十章数据库恢复技术

我的AI工具箱Tauri版-通用音频转文本