当前位置: 首页 > news >正文

llama.cpp批处理选择不同模型启动

.bat文件用 ansi编码

@echo off
rem chcp 65001 >nul
setlocal EnableDelayedExpansiontitle llama-server 模型选择:menu
cls
echo ===============================
echo    llama-server 模型选择
echo ===============================
echo.
echo 请选择要加载的模型:
echo 1. GPT-OSS-20B Q8量化版
echo 2. GPT-OSS-20B FP16版
echo 3. GPT-OSS-20B MXFP4量化版
echo 4. 自定义模型路径
echo 5. 退出
echo.set /p "choice=请输入选择 (1-5): "rem ---------- 选项判断 ----------
if "%choice%"=="1" (set "MODEL_PATH=jinx-gpt-oss-20b-Q8_0.gguf"goto launch
) else if "%choice%"=="2" (set "MODEL_PATH=gpt-oss-20b-F16.gguf"goto launch
) else if "%choice%"=="3" (set "MODEL_PATH=jinx-gpt-oss-20b-mxfp4.gguf"goto launch
) else if "%choice%"=="4" (set /p "MODEL_PATH=请输入模型文件完整路径: "if not exist "!MODEL_PATH!" (echo 错误:模型文件不存在!pausegoto menu)goto launch
) else if "%choice%"=="5" (goto :eof        REM 只结束批处理,不关闭整个 CMD
) else (echo 无效选择,请重新输入!pausegoto menu
):launch
echo.
echo 正在启动模型:!MODEL_PATH!
echo 参数配置:--no-warmup -c 131072 -fa on --jinja
echo.rem 如果你想让服务器在后台运行,可以改成 start "" … 下面的方式会在当前窗口等待服务器结束
llama-server -m "c:\llama\!MODEL_PATH!" --no-warmup -c 131072 -fa on --jinjarem ---------- 错误处理 ----------
if errorlevel 1 (echo.echo llama-server 启动失败!echo 请检查:echo 1. 模型文件是否存在echo 2. 显存是否足够echo 3. 参数配置是否正确pause
) else (echo llama-server 已成功启动。pause
)endlocal

在这里插入图片描述

http://www.dtcms.com/a/519953.html

相关文章:

  • 《从零构建企业级 Java+DeepSeek 智能应用:SpringBoot/Vert.x 双引擎实战,打造热榜级 AI 开发指南》
  • 【存储概念】存储系统中块设备、分区、文件系统的概念及关系
  • (第二篇)Spring AI 基础入门:从环境搭建到模型接入全攻略(覆盖国内外模型 + 本地部署)
  • 容器适配器:Stack与Queue的底层奥秘
  • 2025年10月23日Github流行趋势
  • 上海外贸网站建设公司价格做兼职设计去哪个网站
  • 免费效果图网站wordpress分类目录导航
  • 【完整源码+数据集+部署教程】【运动的&足球】足球比赛分析系统源码&数据集全套:改进yolo11-RFAConv
  • YARN简介
  • PSO-Transformer-BiLSTM分类预测/故障诊断,优化参数为注意力机制头数、学习率、正则化系数、隐藏层单元,图很多,包括分类效果图,混淆矩阵图
  • AJAX 知识
  • 做淘宝推广开网站合适全球最大的设计网站
  • Java-157 MongoDB 存储引擎 WiredTiger vs InMemory:何时用、怎么配、如何验证 mongod.conf
  • 详细-vue3项目初始化配置流程
  • 电子科技网站太原seo排名
  • 销售记账-成本中心/成本会计分配
  • TensorFlow深度学习实战——链路预测
  • 广州网站建设公司品牌太和县建设局网站
  • 帝国网站的互动专栏怎么做做ppt兼职网站
  • SpringBoot-数据访问之JDBC
  • Linux操作系统-父进程的等待:一个关于回收与终结的故事
  • Adobe After Effects 2025(AE2025解锁版) 电影级特效
  • 云栖实录 | DataWorks 发布下一代 Data+AI 一体化平台,开启企业智能数据新时代
  • uv add openai 和 uv pip install openai 的区别
  • 安装了conda和uv如何创建一个项目?
  • 策略模式解决的核心问题是什么?
  • Jenkins远程命令执行漏洞复现:原理详解+环境搭建+渗透实践(CVE-2018-1000861 3种方法)
  • SQLite 数据类型
  • 一般建设网站大概需要多少钱一流的聊城做网站费用
  • 福永网站设计二级建造师最好的网站