当前位置: 首页 > news >正文

ollama迁移已下载的单个模型到服务器

ollama迁移已下载的单个模型到服务器

场景

ollama是面向用户级的,部署和运行都很简单,是否高效就另说了。但最起码,他能充分利用用户的硬件设备,在GPU不足也能调用cpu和内存去加持。

ollama运行的模型基本是量化版本的,一般是Q4_K_M,也就是说正常部署一个14b模型是需要40G左右的显存,经过这么一量化,只需要10G显存就差不多了,虽然效果欠缺了很多哈。

模型文件很大,而且要链接ollama的服务器,基本事业单位都不行。那如何把电脑下载的模型拷贝运行就很重要了,这个教程就是解决这个问题。

方案

  1. 联网的电脑傻瓜式安装ollama
  2. 拉取镜像,执行下面命令:
    ollama pull qwen2.5:14b
    
  3. 下载完成后,执行下面命令,导出配置文件manifest:
    ollama show --modelfile qwen2.5:14b > ./Modelfile
    
  4. 配置文件Modelfile生成在当前目录下, 用文本打开如下:
    在这里插入图片描述
  5. 按指向的位置,拷贝模型文件。
  6. 把模型文件和配置文件一起拷贝到目标服务器。
  7. 在目标服务器修改配置文件的模型文件路径(填写实际路径,看上面步骤截图标红框部分)。
  8. 在目标机器执行以下命令进行模型文件载入。
    ollama create mymodelname -f ./Modelfile
    
  9. 到这里就迁移成功了,可以ollama list查一下了。

结语

其他博客一堆直接找blobs和manifests文件夹拷贝的方法很不靠谱,会出现各种异常,尤其是windows\linux字符问题。而我们这种方式基本等于手动加载模型,还能命名模型。

相关文章:

  • mysql部署错误
  • UI-TARS 体验
  • k8s存储介绍(四)hostpath
  • 23种设计模式-观察者(Observer)设计模式
  • django入门教程之自定义中间件【七】
  • leetcode:136. 只出现一次的数字(python3解法)
  • python 格式化利器
  • 一文读懂Sql Server读写分离和分库分表
  • 鼠标在客户区内按下左键和双击右键
  • 光谱范围与颜色感知的关系
  • Spring学习笔记05——Spring Boot的文件结构2(POJO类)
  • 基于 PHP 内置类及函数的免杀 WebShell
  • 【MySQL】mysql日志文件
  • OpenCV图像拼接(3)图像拼接类cv::detail::MultiBandBlender
  • 前端学习笔记--CSS
  • 【机器学习】线性回归和逻辑回归的区别在哪?
  • 【零基础JavaScript入门 | Day7】三大交互案例深度解析|从DOM操作到组件化开发
  • Netty——I/O 线程模型
  • 最长连续子序列和的所含元素 -- Kadane算法拓展
  • 【C++网络编程】第8篇:协议设计与序列化(Protobuf、FlatBuffers)
  • 做的网站怎样适配手机/优化落实疫情防控
  • 做网站推广的好处/百度一下官网首页百度一下百度
  • 郑州做网站优化公司/联合早报 即时消息
  • 英文网站建设哪家强/域名注册流程
  • 做食品网站需要什么条件/中山seo关键词
  • 旅游电子商务网站模板/群排名优化软件官网