当前位置: 首页 > news >正文

Shimmy - 隐私优先的 Ollama 替代方案

文章目录

    • 一、关于 Shimmy
      • 1、项目概览
      • 2、相关链接资源
      • 3、功能特性
    • 二、安装配置
    • 三、使用示例
      • 1、快速启动
      • 2、Python SDK 集成
    • 四、技术架构
    • 五、性能对比
    • 其它
      • 参考项目


一、关于 Shimmy

1、项目概览

Shimmy 是一个 5.1MB 的单文件二进制工具,提供 100% OpenAI 兼容的 API 端点,用于本地运行 GGUF 模型。它是隐私优先的本地 AI 解决方案,无需配置即可使用。


2、相关链接资源

  • Github:https://github.com/Michael-A-Kuykendall/shimmy
  • 官方文档:https://github.com/Michael-A-Kuykendall/shimmy/raw/main/docs/
  • 开发指南:<DEVELOPERS.md>
  • 演示视频:https://github.com/Michael-A-Kuykendall/shimmy/raw/main/docs/demo.mp4
  • 作者:Michael A. Kuykendall
  • 社区支持:GitHub Issues | GitHub Discussions
  • License:MIT

3、功能特性

1、OpenAI API 兼容

  • 完全兼容 OpenAI API 规范
  • 支持现有 AI 工具无缝切换

2、零配置自动发现

  • 自动发现 Hugging Face/Ollama 模型
  • 自动端口分配避免冲突
  • 自动检测 LoRA 适配器

二、安装配置

# 推荐安装方式
cargo install shimmy --features huggingface# Windows 预编译二进制
curl -L https://github.com/Michael-A-Kuykendall/shimmy/releases/latest/download/shimmy.exe -o shimmy.exe

三、使用示例

1、快速启动

shimmy serve &
shimmy list
curl -s http://127.0.0.1:11435/v1/chat/completions \-H 'Content-Type: application/json' \-d '{"model":"MODEL_NAME","messages":[{"role":"user","content":"Say hi"}],"max_tokens":32}' | jq

2、Python SDK 集成

from openai import OpenAI
client = OpenAI(base_url="http://127.0.0.1:11435/v1", api_key="sk-local")
resp = client.chat.completions.create(model="MODEL_NAME",messages=[{"role": "user", "content": "Say hi"}],max_tokens=32
)

四、技术架构

  • 基于 Rust + Tokio 构建
  • llama.cpp 后端支持
  • 动态端口管理
  • 零配置自动发现机制

五、性能对比

工具二进制大小启动时间内存占用OpenAI兼容性
Shimmy10-20MB<100ms50MB100%
Ollama680MB5-10s200MB+部分

其它

参考项目

  • Ollama
  • llama.cpp

伊织 xAI 2025-09-20(六)

http://www.dtcms.com/a/415577.html

相关文章:

  • 桥东企业做网站跑腿网站建设
  • 用虚拟主机做网站wordpress多城市子站
  • Java 黑马程序员学习笔记(进阶篇14)
  • 网站开发的理解制作网站软件网站
  • 长沙网页网站制作网站建设常用的工具
  • 上海装修网站建设深圳安全教育平台
  • 房子装修报价清单表湖北seo网站多少钱
  • 列举网站开发常用的工具免费软件有哪些
  • jsp网站开发环境配置直播网站开发需要多少钱
  • Ingress:轻松拿捏集群流量管理
  • 网站正在建设中...微信公众号粉丝下单
  • 上海的网站设计公司价格邹城外贸网站建设
  • k8s kubelet 错误 Network plugin returns error: cni plugin not initialized
  • 门户网站首页学校网站班级网页建设制度
  • 中山高端网站建设wordpress 首页 摘要
  • 把server2003安装到腾讯云服务器上nt5.2.3790
  • 交互式多媒体网站开发如何做收费影视资源网站
  • 广州网站开发东莞响应式网站
  • 解决 Vite + React 项目部署 GitHub Pages 的完整指南:从 404 到成功部署
  • 一般做网站什么价格手机网站建设的教程视频教程
  • 网站开发工具的功能包括html网站建设好了怎么在百度可以搜到
  • 电源输入端的 X,Y 安全电容
  • wordpress免费主机优化网站的公司
  • windows 建设网站如何打开网站网页
  • 鸿蒙NEXT传统蓝牙开发指南:从基础到实战的完整解决方案
  • 工商注册网站官网WordPress比赛竞猜插件
  • Gin Web Framework - 高性能 Go Web 框架
  • golang gin 项目从零发布 Kubernetes NodePort 模式
  • 5年经验,没安装部署过Nginx?
  • Java面试-并发面试(二)