当前位置: 首页 > news >正文

大模型推理:LM Studio在Mac上部署Deepseek-R1模型

LM Studio

LM Studio是一款支持离线大模型部署的推理服务框架,提供了易用的大模型部署web框架,支持Linux、Mac、Windows等平台,并提供了OpenAI兼容的SDK接口,主要使用LLama.cpp和MLX推理后端,在Mac上部署时选择MLX推理后端会显著提升大模型的生成速度。

环境信息

  • 机器信息:Mac studio M2 192G, MacOS
  • 部署模型:部署DeepSeek-R1-Distill-LLama-70B 8bit / DeepSeek-R1-Distill-Qwen-32B 8bit 模型
  • 部署框架:LM Studio 0.3.13

安装

  • LM Studio官网下载安装文件,正常安装即可。
    在这里插入图片描述

模型下载

通过命令行或者web界面进行大模型下载时,默认走huggingface.co,国内需要特殊设置才能访问,因此推荐换掉该源使用modelscope或者hf-mirror进行下载。

  • 下载源更换
    • 命令行进入目录:/Applications/LM Studio.app/Contents/Resources/app/.webpack,执行open . ,会以文件形式弹出该目录
    • 文本编辑器分别打开文件:main/index.js和rederer/main_window.js,选择用 modelscope.cn 或者 hf-mirror.com 替换掉 huggingface.co,全部替换,保存关闭
    • 重启LM Studio即可。
  • 大模型下载
    • 方式一:web页面下载
      在web页面选择需要下载的大模型,等待完成即可,完成后在web界面l或者命令行load(lms load [模型名称])。
    • 方式二:命令行形式下载
      在命令窗口使用命令 lms get [model name], 模型名称需要上述下载源里面存在,完成后在web界面l或者命令行load(lms load [模型名称])。
    • 方式三:Git lfs 下载
      上述两种方式,我这儿下载时经常遇到下载暂停的形象,为解决这个问题,推荐 Git 大文件下载方式(推荐Modelscope)。
      • 安装Git lfs、初始化git lfs,可自行deepseek问下。
      • 模型下载后(Mac上通常选择mlx-community仓库中的mlx模型)将其放入目录:~/.lmstudio/models,结构是:仓库名称(可自定义)->包含文件权重的文件夹(文件夹名称可自定义)
      • 最后在web界面l或者命令行load(lms load [模型名称])。
      • 注意:也可通过lms imort命令去导入,但是文件夹下只能含有一个文件,而safetensors文件基本是多个,所以不是很推荐

模型服务

  • 模型load完成后,可在web页面聊天,lm studio自带web聊天界面
  • 模型load完成后,可使用OpenAI SDK接口调用,若提供给局域网其他使用,需开启local server模型并开启局域网访问,可在web界面操作

参考文献

  • LM Studio Docs
  • 在 MacOS 上为 LM Studio 更换镜像源

相关文章:

  • 散货拼柜业务痛点有哪些?货代公司如何通过散拼系统提高效率?
  • Sqlmap注入工具简单解释
  • 差分专题练习 ——基于罗勇军老师的《蓝桥杯算法入门C/C++》
  • 什么是 MyBatis?
  • 【CXX】6.7 SharedPtr<T> — std::shared_ptr<T>
  • 1140:验证子串--next.data()、KMP和find
  • 使用yolov8+flask实现精美登录界面+图片视频摄像头检测系统
  • 代理模式的C++实现示例
  • 15.使用读写包操作Excel文件:OpenPyXL 包
  • 麒麟系统利用pycharm生成deb文件
  • 树莓派上的 TensorFlow Lite:从零开始的摄像头图像识别
  • 深入解析 React Diff 算法:原理、优化与实践
  • 如何逐步迭代衍生出一个网络安全产品
  • Podman 运行redis 报错
  • 警惕!Ollama大模型工具的安全风险及应对策略
  • DataWhale 大语言模型 - GPT和DeepSeek模型介绍
  • Android Studio搭建环境并运行项目
  • Debain-12.9使用xinference部署重排模型/rerank
  • 程序编译生成的文件
  • 面试常见概念区分:并发与并行、同步与异步、阻塞与非阻塞、线程同步与互斥
  • 首届巴塞尔艺术奖公布:大卫·哈蒙斯、曹斐等36人获奖
  • 《习近平新时代中国特色社会主义思想学习论丛》第十一辑至第十五辑出版发行
  • 4月份国民经济顶住压力稳定增长
  • 浙江一教师被指殴打并威胁小学生,教育局通报涉事人被行拘
  • 一箭六星,朱雀二号改进型遥二运载火箭发射成功
  • 网易一季度净利增长三成,丁磊:高度重视海外游戏市场