当前位置：首页 > news >正文

使用Node.js从零搭建DeepSeek本地部署（Express框架、Ollama）

news 2025/10/12 8:33:18

1.安装Node.js和npm

首先确保我们机器上已经安装了Node.js和npm。如果未安装，可以通过以下链接下载并安装适合我们操作系统的版本：
Node.js官方下载页面
关于Node.js的安装可以参考该篇文章：
Node.js的安装及环境配置【超详细】
安装完成后，可以通过以下命令检查是否安装成功：

node -v
npm -v

安装成功界面：

2.初始化项目

使用以下命令，创建一个新的文件夹作为项目目录，并初始化一个Node.js项目：

mkdir deepseek-nodejs
cd deepseek-nodejs
npm init -y

如下图：
以上命令会在当前目录下生成一个package.json文件，用于管理项目的依赖关系和其他配置信息。

3.安装Ollama

访问Ollama官网下载适合我们电脑操作系统的安装包，并按照提示进行安装：
Ollama官方下载页面
对于Linux用户，可以通过以下命令直接安装：

curl -fsSL https://ollama.com/install.sh | sh

安装完成后，验证是否成功安装：

ollama -v

如下图：

在这里插入图片描述

4.下载DeepSeek模型

安装完Ollama后，我们可以通过其界面选择并下载DeepSeek-R1模型。以下是下载并运行DeepSeek-R1 1.5B版本的示例命令：

ollama run deepseek-r1:1.5b

根据我们机器的硬件配置，可以选择不同规模的模型版本，如7B、14B等

不同模型创建命令：
创建命令
不同规模的模型版本参数核心区别：

参数规模	特点和应用场景	部署需求和资源消耗	应用场景
1.5B	适合简单的文本生成任务，如客服话术和短文案生成，但逻辑推理能力较弱‌	适合本地部署，资源消耗低，可以在消费级显卡上运行‌	生成食谱步骤和基础问答‌
7B-8B	适合多轮对话和中等复杂度的任务，如代码补全和基础科研工作‌	适合本地部署，资源消耗低，可以在消费级显卡上运行‌	ChatGPT级对话和中等复杂度代码生成‌
14B	适合多轮对话和中等复杂度的任务，如代码补全和基础科研工作‌	需要在高性能GPU上运行，如A100/H100/H800等‌	科研论文辅助撰写和跨领域知识推理‌
32B	具备接近人类水平的复杂任务处理能力，如法律文档分析和数学证明‌	需要在高性能GPU上运行，如A100/H100/H800等‌	科研论文辅助撰写和跨领域知识推理‌
70B	适用于前沿研究和超高性能计算场景‌	需要多卡并行和云服务支持，适用于全球高并发场景‌	多模态融合和超长文本生成（如小说/剧本）‌
671B	顶尖多任务能力，接近通用人工智能（AGI），适合科研和超大规模企业‌	需要多卡并行和云服务支持，适用于全球高并发场景‌	多模态融合和超长文本生成（如小说/剧本）‌

如下图：

注意：下载过程中，最开始下载速度可能要快一些，下载到后面可能就几十KB/s了，此时我们可以按Ctrl+C停止下载，然后再重新执行下载命令，此时的下载速度又恢复到了几MB/s了，如此循环往复操作，很快下载好

在这里插入图片描述

执行成功，可以问答：
使用 /bye 命令进行退出：

5.创建Node.js服务器

为了使DeepSeek可以通过API接口访问，我们可以使用Express框架创建一个简单的Node.js服务器。首先，安装Express：

npm install express

关于Express可以参考该篇文章：
当面试官问你关于Node.js的开发框架Express时，你怎么回答？
然后，在项目根目录下创建一个名为server.js的文件，并添加以下示例代码：

const express = require('express');
const { exec } = require('child_process');

const app = express();
const PORT = process.env.PORT || 3000;

app.use(express.json());

app.post('/query', (req, res) => {
    const query = req.body.query;
    if (!query) {
        return res.status(400).send({ error: 'query必填'});
    }

    // 使用提供的查询执行ollama命令
    exec(`ollama run deepseek-r1:1.5b -- ${query}`, (error, stdout, stderr) => {
        if (error) {
            return res.status(500).send({ error: '请求出错' });
        }
        res.send({ response: stdout });
    });
});

app.listen(PORT, () => {
    console.log(`服务运行在${PORT}端口`);
});