当前位置: 首页 > wzjs >正文

旅游型网站建设用个人电脑做网站的步骤

旅游型网站建设,用个人电脑做网站的步骤,制作书签图片,开发棋牌游戏软件需要多少钱ktransformers 上的 DeepSeek-R1 671B open-webui 一、下载GGUF模型1. 创建目录2. 魔塔下载 DeepSeek-R1-Q4_K_M3. 安装显卡驱动和cuda4. 显卡 NVIDIA GeForce RTX 4090 二、安装ktransformers1. 安装依赖2. 安装uv工具链3. 下载源码4. 创建python虚拟环境 三、编译ktransforme…

ktransformers 上的 DeepSeek-R1 671B open-webui

  • 一、下载GGUF模型
    • 1. 创建目录
    • 2. 魔塔下载 DeepSeek-R1-Q4_K_M
    • 3. 安装显卡驱动和cuda
    • 4. 显卡 NVIDIA GeForce RTX 4090
  • 二、安装ktransformers
    • 1. 安装依赖
    • 2. 安装uv工具链
    • 3. 下载源码
    • 4. 创建python虚拟环境
  • 三、编译ktransformers
  • 四、运行ktransformers
    • 1. 后台运行
    • 2. API 测试
  • 五、open-webui 集成
    • 1. 安装 open-webui
    • 2. 运行脚本go.sh
    • 3. 启动过程很慢,监听端口 3000 运行后可以访问web界面
  • 参考

一、下载GGUF模型

1. 创建目录

mkdir DeepSeek-R1-GGUF

2. 魔塔下载 DeepSeek-R1-Q4_K_M

https://www.modelscope.cn/models/unsloth/DeepSeek-R1-GGUF

3. 安装显卡驱动和cuda

wget https://developer.download.nvidia.com/compute/cuda/12.6.0/local_installers/cuda_12.6.0_560.28.03_linux.run
sudo sh cuda_12.6.0_560.28.03_linux.run

4. 显卡 NVIDIA GeForce RTX 4090

NVIDIA-SMI 560.35.05 
CUDA Version: 12.6  

二、安装ktransformers

1. 安装依赖

sudo apt-get install git

2. 安装uv工具链

curl -LsSf https://astral.sh/uv/install.sh | sh
source $HOME/.local/bin/env
which uv
which uvx

3. 下载源码

git clone https://github.com/kvcache-ai/ktransformers.git
cd ktransformers
git checkout 94ab2de
git rev-parse --short HEAD # 应显示 94ab2de

4. 创建python虚拟环境

# uv venv ./venv --python 3.11 --python-preference=only-managed
Using CPython 3.11.11
Creating virtual environment at: ./venv
Activate with: source venv/bin/activate

三、编译ktransformers

apt-get install build-essential cmake
source venv/bin/activate
uv pip install -r requirements-local_chat.txt
uv pip install setuptools wheel packaging
# uv pip install setuptools wheel packaging
Using Python 3.11.11 environment at: 
Resolved 3 packages in 454ms
Prepared 1 package in 133ms
░░░░░░░░░░░░░░░░░░░░ [0/2] Installing wheels...                                                                                                     warning: Failed to hardlink files; falling back to full copy. This may lead to degraded performance.If the cache and target directories are on different filesystems, hardlinking may not be supported.If this is intentional, set `export UV_LINK_MODE=copy` or use `--link-mode=copy` to suppress this warning.
Installed 2 packages in 102ms+ setuptools==75.8.0+ wheel==0.45.1# uv pip install --link-mode=copy packaging
Using Python 3.11.11 environment at:
Audited 1 package in 2ms
系统的物理CPU核心数量
export MAX_JOBS=72
export CMAKE_BUILD_PARALLEL_LEVEL=72
# 安装flash_attn
uv pip install flash_attn --no-build-isolation
export UV_LINK_MODE=copy
uv pip install flash_attn --no-build-isolation
export USE_NUMA=1
git submodule init
git submodule update
KTRANSFORMERS_FORCE_BUILD=TRUE uv pip install . --no-build-isolation

四、运行ktransformers

PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True python3 ktransformers/server/main.py \--gguf_path /DeepSeek-R1-GGUF/DeepSeek-R1-Q4_K_M/ \--model_path deepseek-ai/DeepSeek-R1 \--model_name unsloth/DeepSeek-R1-GGUF \--cpu_infer 16 \--max_new_tokens 8192 \--cache_lens 32768 \--total_context 32768 \--cache_q4 true \--temperature 0.6 \--top_p 0.95 \--optimize_config_path ktransformers/optimize/optimize_rules/DeepSeek-V3-Chat.yaml \--force_think \--use_cuda_graph \--host 0.0.0.0 \--port 8080

1. 后台运行

nohup env PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True python3 ktransformers/server/main.py \--gguf_path /DeepSeek-R1-GGUF/DeepSeek-R1-Q4_K_M/ \--model_path deepseek-ai/DeepSeek-R1 \--model_name unsloth/DeepSeek-R1-GGUF \--cpu_infer 16 \--max_new_tokens 8192 \--cache_lens 32768 \--total_context 32768 \--cache_q4 true \--temperature 0.6 \--top_p 0.95 \--optimize_config_path ktransformers/optimize/optimize_rules/DeepSeek-V3-Chat.yaml \--force_think \--use_cuda_graph \--host 0.0.0.0 \--port 8080 >> server.log 2>&1 &

2. API 测试

curl http://IP:8080/v1/chat/completions \-H "Content-Type: application/json" \-d '{"model": "DeepSeek-R1","messages": [{"role": "user", "content": "你是谁!"}]}'

五、open-webui 集成

1. 安装 open-webui

mkdir open-webui
cd open-webui
uv venv ./venv --python 3.11
source venv/bin/activate
uv pip install open-webui

2. 运行脚本go.sh

#!/usr/bin/env bashsource venv/bin/activate# open-webui 不原生支持HOST和PORT环境变量,需手动传递参数
# https://docs.openwebui.com/getting-started/env-configuration/#port
# 若open-webui运行异常,可执行`rm -rf ./data`清除数据后重启服务并清理浏览器缓存export DATA_DIR="$(pwd)/data"
export ENABLE_OLLAMA_API=False
export ENABLE_OPENAI_API=True
export OPENAI_API_KEY="dont_change_this_cuz_openai_is_the_mcdonalds_of_ai"
export OPENAI_API_BASE_URL="http://IP:8080/v1" # <--- 需与ktransformers/llama.cpp的API配置匹配
#export DEFAULT_MODELS="openai/foo/bar" # <--- 保留注释,此参数用于`litellm`接入
export WEBUI_AUTH=False
export DEFAULT_USER_ROLE="admin"
export HOST=0.0.0.0
export PORT=3000 # <--- open-webui网页服务端口open-webui serve \--host $HOST \--port $PORT# 在浏览器中访问显示的URL:端口

3. 启动过程很慢,监听端口 3000 运行后可以访问web界面

netstat -netlp    

在这里插入图片描述

参考

  1. ktransformers 上的 DeepSeek-R1 671B
  2. ktransformers
http://www.dtcms.com/wzjs/808290.html

相关文章:

  • 校园门户网站南宁哪家公司建设网站比较好
  • 济南网站建设工作室广州市市花
  • 网站改进建议有哪些淮南招聘网站建设
  • 广州网站开发哈尔滨网站建设推广
  • 杭州网站制作哪家好太原建设银行保安招聘网站
  • 关于网站建设的简历wordpress企业中文模板下载
  • 网站系统改教程建站平台需要授权吗
  • 网站维护怎么样wordpress漫画程序
  • 工会网站建设安徽做网站公司哪家好
  • seo做的最好的网站企业管理软件erp
  • 保山市住房和建设局网站下载网页制作模板
  • 香河住房与建设局网站网站首页设计有限公司
  • wordpress菜单不能打开seo需要付费吗
  • 百度找不到 网站引用网站资料怎么注明
  • 网站建设的流程分析com网站域名
  • 专业做网站公司24小时接单国学网站源码
  • wordpress网站名称帝国企业网站源码
  • 网站建设的布局安卓开发用什么开发工具
  • 威海做网站的公司网站服务器防火墙设置
  • 贵阳网站开发谁家做的好新东方线下培训机构官网
  • 寻找网站设计与制作抢车票网站怎么做
  • 深圳网络营销网站网站基本特点
  • 做付费动漫网站关于网站建设规划方书案例样式
  • 辽宁省建设工程信息网官网新网站入口官方gta5办公室网站正在建设
  • 建设了网站后怎么用谷歌引流免费做网站tk
  • 最有性价比的网站建设学校网站模板注意事项
  • 网站建设背景论文图书馆信息化网站建设
  • 建设银行e路通网站厦门图书馆网站建设
  • 自己的电脑可以做网站服务器吗网站的商业授权
  • 现在流行用什么做网站俄罗斯免费网站推广