当前位置：首页 > news >正文

【记录】高性能服务器运行DeepSeek

news 2025/10/13 21:39:13

搭建代理服务器

一般情况下高性能服务器为了安全起见，仅仅在内网使用，无法上公网，因此第一步配置代理服务器，让高性能服务器可以上公网。

首选Windows + CCProxy免费版
官网地址：http://www.ccproxy.com/
在这里插入图片描述
基本设置

设置防火墙，开放808端口

记下代理服务器地址:
http://代理服务器IP:808
高性能服务器上要用。

下载Ollama程序

在自己电脑上登录Ollama官网
https://ollama.com/download/linux
点击手动指令
在这里插入图片描述
跳转到了github
https://github.com/ollama/ollama/blob/main/docs/linux.md
下载这个文件

注意：有可能版本太高，需要升级glibc
如果不想升级的话，或者无权限升级的话，可以考虑用低版本的。v0.5.12
https://github.com/ollama/ollama/releases
在这里插入图片描述

高性能服务器操作

上载Ollama

通过FileZilla将’"ollama-linux-amd64.tgz"传到远程高性能服务器。

解压

注意：这里和官网文档不一致。
我其解压到我的主目录下的.local文件夹内。

mkdir -p ~/.local
tar -C ~/.local -xzf ollama-linux-amd64.tgz

检查GPU卡

sinfo -o "%10n %10G %10t"
sinfo

[abc@login01 ~]$ sinfo
PARTITION AVAIL TIMELIMIT NODES STATE NODELIST
cn up infinite 2 down* cn[15,21]
cn up infinite 5 mix cn[08-10,17,22]
cn up infinite 17 alloc cn[01-07,11-14,16,18-20,23-24]
cn1 up infinite 5 mix cn[31,42,44-46]
cn1 up infinite 17 alloc cn[25-30,32-41,43]
fat up infinite 1 mix fat01
gpu2 up infinite 1 mix gpu02
gpu3 up infinite 1 mix gpu03
gpu4 up infinite 1 down* gpu05
gpu4 up infinite 1 mix gpu04
gpu5 up infinite 1 down* gpu06
gpu5 up infinite 1 alloc gpu08
gpu6* up infinite 1 alloc gpu07

找一个可用的显卡，比如 “gpu3 up infinite 1 mix gpu03”，登录

登录Slurm 集群

srun -w gpu03 -p gpu3 -n 1 --pty bash

检查NVIDA GPU

nvidia-smi
nvidia-smi -L

设置参数

export OLLAMA_GPU_LAYER=cuda
export CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7
export OLLAMA_NUM_GPU=8
export OLLAMA_GPU_LAYERS=35
export OLLAMA_KEEP_ALIVE=1800
# 添加path
export PATH="$HOME/.local:$PATH"
# 设置开放端口
export OLLAMA_HOST="127.0.0.1:3001"
# 允许跨域访问
export OLLAMA_ORIGINS="*"

# 设置代理服务器（应该是下面其中一个，全加，未测）
export HTTPS_PROXY="http://代理服务器IP:808"
export HTTP_PROXY="http://代理服务器IP:808"
# 立即生效
source ~/.bashrc

启动Ollama

ollama serve &> /dev/null &
ollama  run deepseek-r1:32b

查看全文

http://www.dtcms.com/a/55399.html

JavaScript（最后一个元素的索引就是数组的长度减 1）array.length - 1

清华北大推出的 DeepSeek 教程（附 PDF 下载链接）

[傻瓜式教学]如何将MathType公式编辑器内嵌到WPS工具栏中

刘火良 FreeRTOS内核实现与应用之1——列表学习

langchain系列（九）- LangGraph 子图详解

从零开始实现大语言模型（十三）：预训练大语言模型GPTModel

VUE_自定义指令，全局指令注册

LBE大空间文档

PostgreSQL 数据库专家可从事以的工作

计算机基础：二进制基础06，用八进制来计数

【Flink银行反欺诈系统设计方案】6.用户画像数据与反欺诈系统的关联思路

nature genetics | SCENT：单细胞多模态数据揭示组织特异性增强子基因图谱，并可识别致病等位基因

Ubuntu 下 nginx-1.24.0 源码分析 - ngx_init_cycle 函数

题解：AT_past202109_h 最短経路

机器学习在地图制图学中的应用

c++ 重写基类成员函数

RSA的理解运用与Pycharm组装Cryptodome库

案例1_3：流水灯

云端秘境：EC2的奇幻之旅

Linux系统上安装kafka

设计模式-创建型模式详解

php代码审计工具-rips

【时间序列聚类】从数据中发现隐藏的模式

轻松上手 —— 通过 RPM 包快速部署 NebulaGraph

Kubernetes Pod网络组件解析与选型指南

JJJ：linux sysfs相关

高阶哈希算法

以商业思维框架为帆，驭创业浪潮前行

哪吒2票房分析

解析 SQL，就用 sqlparse！