当前位置: 首页 > news >正文

【本地AI大模型部署+可视化界面图文教程】Ollama+Qwen3

文章目录

    • Ollama简介
    • 安装Ollama
    • Ollama相关操作
    • 拉取大模型镜像
    • 使用大模型
    • 实现可视化界面
    • 配置Chatbox
    • 使用可视化大模型

Ollama简介

Ollama 是一款大模型容器管理框架,旨在帮助用户快速在本地部署和运行大模型。

它具备以下核心优势:
1.硬件自适应:无需手动配置,可自动检测电脑硬件,优先调用GPU(若支持)或使用CPU运行模型,降低操作门槛。
2.跨平台兼容:支持 Windows(仅 Win10 及以上系统)、macOS 和 Linux 系统。

特别注意,对于Windows 系统,仅支持Windows 10 或更高版本(需 64 位系统)。

安装Ollama

访问:

https://ollama.com/download/windows

在这里插入图片描述

点击下载:

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

安装完成后,电脑右下角任务栏会显示Ollama图标:

在这里插入图片描述

打开cmd命令窗口,输入以下命令查看安装版本:

Ollama -v

在这里插入图片描述

若输出如上图,则说明安装成功。

Ollama相关操作

如果不小心关闭了Ollama程序,输入以下命令即可重新启动Ollama服务:

ollama serve

在这里插入图片描述

也可以直接在应用程序中打开ollama应用程序。


Ollama serve默认端口为127.0.0.1:11434,这个端口会在后面用到。

在这里插入图片描述


如果不设置模型文件保存位置,模型文件会自动保存在C盘。时间久了,C盘很容易存满。

因此可打开系统环境变量配置,添加一个环境变量OLLAMA_MODELS=D:\Ollama(指定文件夹),然后点确定。

在这里插入图片描述

拉取大模型镜像

镜像中包含了运行大模型所需的所有文件(如模型参数、代码、依赖程序),就像快递里装着组装玩具的零件、说明书和工具,大幅降低使用门槛。

访问以下链接:

https://ollama.com/

点击左上角Models:

在这里插入图片描述

这里有非常多的大模型镜像供我们选择:

在这里插入图片描述

本文选择Qwen3

具体介绍:https://ollama.com/library/qwen3

在这里插入图片描述

选择Qwen3中的qwen3:1.7b,复制右上角的命令:

ollama run qwen3:1.7b

在这里插入图片描述

打开cmd窗口,输入刚刚复制的ollama run qwen3:1.7b

Ollama将拉取Qwen的镜像文件,然后运行Qwen模型:

在这里插入图片描述

在这里插入图片描述

成功后将显示success:

在这里插入图片描述

以下命令可以列出当前主机存在的大模型:

ollama list 

在这里插入图片描述

使用大模型

在这里插入图片描述
在这里插入图片描述

实现可视化界面

命令行界面的操作不够直观、学习成本较高,如何通过图形化界面便捷地使用大模型?Chatbox可以使用户通过图形化界面访问本地大模型。

访问Chatbox官网:

https://chatboxai.app/zh

下载:

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

此时Chatbox已安装成功。

配置Chatbox

进入软件界面,选择“使用自己的API Key或本地模型”:

在这里插入图片描述

由于我们使用Ollama,因此选择Ollama API:

在这里插入图片描述

在以下界面输入:

http://127.0.0.1:11434

在这里插入图片描述

127.0.0.1:11434是什么意思?它与服务的联系是什么?
127.0.0.1 是本地回环地址,代表设备自身,用于本地网络通信测试;11434 是端口号,标识特定服务。
二者组合“127.0.0.1:11434”指向本地主机上占用该端口的服务,常见于开发测试中访问本地运行的程序,如 Web 服务、调试工具等,通过端口区分不同进程,这里是ollama服务。

输完后点击“获取”,软件将自动获取我们电脑上已经安装的AI模型:

在这里插入图片描述

在设置界面选择默认模型为Qwen3:

在这里插入图片描述

在对话界面选择模型为qwen3:

在这里插入图片描述

使用可视化大模型

在这里插入图片描述

测试:

在这里插入图片描述

相关文章:

  • Unity中的transform.up
  • 【创新算法】改进深度优先搜索算法配合二进制粒子群的配电网故障恢复重构研究
  • 嵌入式学习--江协stm32day5
  • uni-app学习笔记二十九--数据缓存
  • 【ArcGIS Pro微课1000例】0072:如何自动保存编辑内容及保存工程?
  • OD 算法题 B卷【模拟工作队列】
  • 【threejs】每天一个小案例讲解:创建基本的3D场景
  • 【Go语言基础【18】】Map基础
  • 利用pandas gradio实现简单的项目子项拆解及排期
  • idea 启动jar程序并调试
  • HTML前端开发:JavaScript 常用事件详解
  • JS的传统写法 vs 简写形式
  • Spring框架的设计模式
  • 打卡第39天:Dataset 和 Dataloader类
  • Spring Cloud 微服务架构实战指南 -- SpringCLoud概述
  • BeckHoff_FB --> SET_SNB 功能块
  • Halcon案例(三):C#联合Halcon识别排线
  • 【RAG召回】bge实现向量相似度索引
  • 四.抽象工厂模式
  • 如何在Spring Boot中使用注解动态切换实现
  • 手机网站推广怎么做/seo需要会什么
  • 怎么在网站做系统/百度竞价最低点击一次多少钱
  • 网站模板 扁平化/淘宝运营培训课程
  • 南昌疫情最新政策/兰州seo优化
  • wordpress主题模块添加图片尺寸/酒泉网站seo
  • 网站可以有二维码吗/seo搜索引擎优化费用