当前位置：首页 > news >正文

Shimmy - 隐私优先的 Ollama 替代方案

news 2025/9/28 10:08:49

文章目录

- 一、关于 Shimmy
- - 1、项目概览
  - 2、相关链接资源
  - 3、功能特性
- 二、安装配置
- 三、使用示例
- - 1、快速启动
  - 2、Python SDK 集成
- 四、技术架构
- 五、性能对比
- 其它
- - 参考项目

一、关于 Shimmy

1、项目概览

Shimmy 是一个 5.1MB 的单文件二进制工具，提供 100% OpenAI 兼容的 API 端点，用于本地运行 GGUF 模型。它是隐私优先的本地 AI 解决方案，无需配置即可使用。

2、相关链接资源

Github：https://github.com/Michael-A-Kuykendall/shimmy
官方文档：https://github.com/Michael-A-Kuykendall/shimmy/raw/main/docs/
开发指南：<DEVELOPERS.md>
演示视频：https://github.com/Michael-A-Kuykendall/shimmy/raw/main/docs/demo.mp4
作者：Michael A. Kuykendall
社区支持：GitHub Issues | GitHub Discussions
License：MIT

3、功能特性

1、OpenAI API 兼容

完全兼容 OpenAI API 规范
支持现有 AI 工具无缝切换

2、零配置自动发现

自动发现 Hugging Face/Ollama 模型
自动端口分配避免冲突
自动检测 LoRA 适配器

二、安装配置

# 推荐安装方式
cargo install shimmy --features huggingface# Windows 预编译二进制
curl -L https://github.com/Michael-A-Kuykendall/shimmy/releases/latest/download/shimmy.exe -o shimmy.exe

三、使用示例

1、快速启动

shimmy serve &
shimmy list
curl -s http://127.0.0.1:11435/v1/chat/completions \-H 'Content-Type: application/json' \-d '{"model":"MODEL_NAME","messages":[{"role":"user","content":"Say hi"}],"max_tokens":32}' | jq

2、Python SDK 集成

from openai import OpenAI
client = OpenAI(base_url="http://127.0.0.1:11435/v1", api_key="sk-local")
resp = client.chat.completions.create(model="MODEL_NAME",messages=[{"role": "user", "content": "Say hi"}],max_tokens=32
)

四、技术架构

基于 Rust + Tokio 构建
llama.cpp 后端支持
动态端口管理
零配置自动发现机制

五、性能对比

工具	二进制大小	启动时间	内存占用	OpenAI兼容性
Shimmy	10-20MB	<100ms	50MB	100%
Ollama	680MB	5-10s	200MB+	部分

其它

参考项目

Ollama
llama.cpp

伊织 xAI 2025-09-20（六）

http://www.dtcms.com/a/415577.html

相关文章：

桥东企业做网站跑腿网站建设

用虚拟主机做网站wordpress多城市子站

Java 黑马程序员学习笔记（进阶篇14）

网站开发的理解制作网站软件网站

长沙网页网站制作网站建设常用的工具

上海装修网站建设深圳安全教育平台

房子装修报价清单表湖北seo网站多少钱

列举网站开发常用的工具免费软件有哪些

jsp网站开发环境配置直播网站开发需要多少钱

Ingress：轻松拿捏集群流量管理

网站正在建设中...微信公众号粉丝下单

上海的网站设计公司价格邹城外贸网站建设

k8s kubelet 错误 Network plugin returns error: cni plugin not initialized

门户网站首页学校网站班级网页建设制度

中山高端网站建设wordpress 首页摘要

把server2003安装到腾讯云服务器上nt5.2.3790

交互式多媒体网站开发如何做收费影视资源网站

广州网站开发东莞响应式网站

解决 Vite + React 项目部署 GitHub Pages 的完整指南：从 404 到成功部署

一般做网站什么价格手机网站建设的教程视频教程

网站开发工具的功能包括html网站建设好了怎么在百度可以搜到

电源输入端的 X,Y 安全电容

wordpress免费主机优化网站的公司

windows 建设网站如何打开网站网页

鸿蒙NEXT传统蓝牙开发指南：从基础到实战的完整解决方案

工商注册网站官网WordPress比赛竞猜插件

Gin Web Framework - 高性能 Go Web 框架

golang gin 项目从零发布 Kubernetes NodePort 模式

5年经验，没安装部署过Nginx?

Java面试-并发面试(二)