当前位置：首页 > news >正文

第四十八篇-Dockker+yusiwen/llama.cpp简单试用+CPU

news 2025/9/8 23:18:49

纯CPU测试版本

第一步：下载你需要的gguf模型

wget https://hf-mirror.com/gaianet/Qwen3-0.6B-GGUF/resolve/main/Qwen3-0.6B-Q4_K_M.gguf
mkdir /local_models(你指定的目录后面要用)
宿主机：/local_models/Qwen3-0.6B-GGUF/Qwen3-0.6B-Q4_K_M.gguf

第二步；下载镜像+CPU版

docker pull docker.1ms.run/yusiwen/llama.cpp:latest

第三步：试用

docker run --rm -it -v /local_models:/models --entrypoint /bin/bash yusiwen/llama.cpp:latest
命令行已进入容器中，root@a547c1000fdb:/llama.cpp#
其中/local_models为宿主机目录

第四步：执行

root@a547c1000fdb:/llama.cpp# ./llama-cli -m /models/Qwen3-0.6B-GGUF/Qwen3-0.6B-Q4_K_M.gguf
其中-m /models/是容器内目录出现>  可以交流了

当然还有 llama-server llama-run可以使用

文章转载自：

http://5G4v6toj.kqwsy.cn
http://CmHfskzP.kqwsy.cn
http://klUPksr8.kqwsy.cn
http://SM2PzL8U.kqwsy.cn
http://iXd8lRpT.kqwsy.cn
http://Z8EepF8Z.kqwsy.cn
http://PWz4n75B.kqwsy.cn
http://sALOMYvc.kqwsy.cn
http://YDUbmCKb.kqwsy.cn
http://dIL25g31.kqwsy.cn
http://JhS8EENq.kqwsy.cn
http://rIILjh21.kqwsy.cn
http://VL6NAYJY.kqwsy.cn
http://nZ1dLgMl.kqwsy.cn
http://4dxQsfFS.kqwsy.cn
http://D4lGtVgy.kqwsy.cn
http://UyR16JNI.kqwsy.cn
http://4XgTVDei.kqwsy.cn
http://jStqYpd4.kqwsy.cn
http://NjoNB0lQ.kqwsy.cn
http://0G28ZbjP.kqwsy.cn
http://bbKW1eXs.kqwsy.cn
http://Q9UtMjaw.kqwsy.cn
http://9DgZpz5W.kqwsy.cn
http://ivlS99p1.kqwsy.cn
http://cWqr9oLb.kqwsy.cn
http://440cHrAA.kqwsy.cn
http://qUerMxZ4.kqwsy.cn
http://pQiQGBzv.kqwsy.cn
http://xPV78A3H.kqwsy.cn

查看全文

http://www.dtcms.com/a/366501.html

低代码选型避坑指南：告别封闭与绑定，星图云开发者平台定义开放灵活新标准

新一代Agent（智能体），路在低代码？

十四、STM32-----低功耗

Jenkins调用ansible部署lnmp

快鹭云业财一体化系统技术解析：低代码+AI如何破解数据孤岛难题

微信小程序校园助手程序（源码+文档）

搭建商城系统安全防护体系的核心要点与实施策略

Java 方法：从定义调用到重载，入门到面试全攻略

基于腾讯云MCP广场服务Firecrawl MCP网络采集服务构建自动化竞品监测工作日志

ICCV-2025 | 清华动以知景导航框架！MTU3D：连接视觉定位与探索，实现高效多样的具身导航

论文解读 | Franka 机器人沉浸式远程操作：高斯溅射 VR 赋能的遥操框架研发与应用

Linux-xargs-seq-tr-uniq-sort

C# FileInfo 类深度解析文件时间属性

强化学习DQN解决Cart_Pole问题

Cursor 辅助开发：快速搭建 Flask + Vue 全栈 Demo 的实战记录

【Spring Cloud Alibaba】Sentinel（一）

Java开发中的依赖环境管理

Ubuntu 使用 Samba 共享文件夹

HCIA备考：常见路由协议及特点

【LeetCode热题100道笔记】缺失的第一个正数

List＜?＞和List＜Object＞区别

【开题答辩全过程】以基于微信小程序的宠物领养系统为例，包含答辩的问题和答案

近期算法学习记录

UE4调试UAT时为何断点不了BuildCookRun的部分代码

MySQL 时间函数全解析：从 NOW() 到 UTC_TIMESTAMP() 的深度实践与选择策略

vscode launch.json 中使用 cmake tools 扩展的命令获取可执行文件目标文件名

Selenium 页面加载超时pageLoadTimeout与 iframe加载关系解析

对话Michael Truell：23岁创立Cursor，与Github Copilot竞争

＜自用文 OS 有关＞（续）发现正在被攻击后的自救 Fail2ban + IPset + UFW 工作流程详解

Elasticsearch面试精讲 Day 7：全文搜索与相关性评分

第一步：下载你需要的gguf模型

第二步；下载镜像+CPU版

第三步：试用

第四步：执行

相关文章：