当前位置: 首页 > news >正文

mac m1安装大模型工具vllm

1 更新系统环境

参考vllm官网文档,vllm对apple m1平台mac os, xcoder, clang有如下要求

OS: macOS Sonoma or later

SDK: XCode 15.4 or later with Command Line Tools

Compiler: Apple Clang >= 15.0.0

在App Store更新macOS和XCoder,依据XCoder版本号安装command line tools。

https://developer.apple.com/download/all/?q=Command%20Line%20Tools

 2 安装anconda并初始化虚拟环境

下载并安装apple m1版本anconda

比如 Anaconda3-2025.06-0-MacOSX-arm64.pkg

https://www.anaconda.com/download-success

初始化conda虚拟环境

conda create -n vllm python=3.12

conda activate vllm

3 安装vllm

1)下载vllm

git clone https://github.com/vllm-project/vllm.git

大部分情况git clone会失败,所以直接下载vllm的release版本,这里下载0.92,链接如下。

https://github.com/vllm-project/vllm/releases/download/v0.9.2/vllm-0.9.2.tar.gz

https://github.com/vllm-project/vllm/releases

2)安装vllm

先安装依赖

cd vllm

pip install -r requirements/cpu.txt

conda install cmake

conda install ninja

再安装vllm

pip install -e .

需注意的是以上操作要在mac自带终端下完成,在iterm下会遇到编译问题。

4 验证vllm

vLLM 将 Hugging Face 模型下载到本地,默认 ~/cache/huggingface/hub 文件夹中。

以下是测试代码。

import osos.environ["HF_ENDPOINT"] = "https://hf-mirror.com"from vllm.entrypoints.llm import LLM
from vllm.sampling_params import SamplingParamsmodel_name = "deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B"llm = LLM(model=model_name, max_model_len=128)sampling_params = SamplingParams(temperature = 0.9,max_tokens = 100)
prompt = "中国首都在那?"
output = llm.generate(prompt, sampling_params)print(output)
print(output[0].outputs[0].text)

另外,vLLM 还可以作为服务运行。

目前存在的问题是运行慢,后续看看有效的量化方法。

reference

---

vllm

https://github.com/vllm-project/vllm.git

vllm CPU install doc

https://docs.vllm.ai/en/latest/getting_started/installation/cpu.html

mac command line tools

https://developer.apple.com/download/all/?q=Command%20Line%20Tools

小白入门:使用vLLM在本机MAC上部署大模型

https://www.53ai.com/news/OpenSourceLLM/2025040116542.html

hf-mirror

https://hf-mirror.com/

http://www.dtcms.com/a/270726.html

相关文章:

  • kotlin学习,val使用get()的问题
  • mysql 安装实战
  • Claude Code 开发使用技巧
  • User手机上如何抓取界面的布局uiautomatorviewer
  • Linux的`if test`和`if [ ]中括号`的取反语法比较 笔记250709
  • Unity Demo-3DFarm详解-其二
  • 以太坊智能合约核心技术解析与应用实践
  • LLaMA-Omni 深度解析:打开通往无缝人机语音交互的大门
  • HCIP 认证可以做什么?如何选择合适的职业路径?
  • C++11 future、promise实现原理
  • AI生成交互式数据图表
  • 【c++八股文】Day5:const和constexpr,define
  • sql查询davinci看板数据
  • 【一起来学AI大模型】PyTorch DataLoader 实战指南
  • 极简相册管理ios app Tech Support
  • ARM汇编编程(AArch64架构)课程 - 第7章:SIMD与浮点运算
  • 2025杰理蓝牙芯片:各系列芯片特点及市场分析
  • 【手写 new 操作符实现 - 深入理解 JavaScript 对象创建机制】
  • 【Linux】权限的概念及理解
  • VR/AR在HMI中的创新应用:远程协作与维修的沉浸式体验
  • 类和对象拓展——日期类
  • 【实习篇】之Http头部字段之Disposition介绍
  • 使用 Docker 搭建 Rust Web 应用开发环境——AI教你学Docker
  • VR重现红军过雪山:一场穿越时空的精神洗礼​
  • MySQL 09 普通索引和唯一索引
  • MySQL 间隙锁
  • pytorch 自动微分
  • 半导体晶圆检测的基本知识
  • EGARCH
  • Linux C 目录流基本操作