当前位置: 首页 > news >正文

利用大模型deepseek搭建本地知识库并且实现 java 调用

一、安装大模型

1、首先是下载 ollama点击下载;
选择适合自己操作系统的版本,ollama是一个开源的 LLM(大型语言模型)服务工具,用于本地环境快速搭建部署大模型。
在这里插入图片描述
在这里插入图片描述
2、傻瓜式安装ollama即可,默认安装路径是不需要配置环境变量的;

安装ollama会强制安装到c盘,所以环境变量是配置好的,下次再进入执行cmd黑窗口就行

3、选择大模型,比如deepseek R1;
在这里插入图片描述
4、点击对应大模型,选择合适的版本,比如1.5b;
在这里插入图片描述
5、复制右侧执行脚本下载大模型并启动;
在这里插入图片描述
在这里插入图片描述

第一次执行命令可能会下载失败,多执行几次就好了!!!
如果退出或者关闭命令窗口,再次进入也是通过 ollama run deepseek-r1:1.5b 命令启动大模型;

6、测试效果;
在这里插入图片描述

二、安装前端可视化页面open-webUI

1、下载miniconda点击下载;
选择适合自己操作系统的版本,下载后需要配置环境变量;
2、下载 python点击下载;
python 也需要配置环境变量,如果之前已经安装过就可以忽略该步骤;
在这里插入图片描述
3、创建webUI环境:conda create -n open-webui pyhton==3.12.6
在这里插入图片描述

⚠️注意:python 需要配置环境变量且版本号一致!

4、激活webUI环境:activate open-webui
在这里插入图片描述
5、在open-webui环境下安装依赖:pip install open-webui
在这里插入图片描述
6、启动open-webui服务:open-webui serve 在这里插入图片描述
在这里插入图片描述

⚠️注意:启动 open-webui 的时候需要保证大模型服务是启动状态!
在这里插入图片描述

7、访问页面:127.0.0.1:8080
在这里插入图片描述
8、创建账户
在这里插入图片描述
9、选择自己的模型就可以使用了
在这里插入图片描述

三、搭建本地知识库

1、设置解析文档需要使用的大模型
在这里插入图片描述
2、上传文件到知识库
在这里插入图片描述
3、进入大模型选择上传的文件
在这里插入图片描述
在这里插入图片描述
5、重新登录防止不生效
在这里插入图片描述
6、测试效果
在这里插入图片描述
通过后台日志可以看到确实是使用的上传文件进行的解析匹配
在这里插入图片描述
这是我上传的文件,通过测试发现 1.5b 的效果不是很好,或者是我提供的文件格式不太好,可以试试以问答模式提供的文件效果。
在这里插入图片描述

四、总结

1、作为开发人员,肯定是希望能通过 api 的模式调用大模型,下面介绍下ollama的 api 使用方式。
Ollama默认端口为 11434
Ollama api:
获取模型列表 : http://localhost:11434/api/tags
对话生成文本‌: curl -X POST http://127.0.0.1:11434/api/generate -d'{"model":"deepseek-r1:1.5b", "prompt":"我是谁", "stream":false}'
model: 使用的大模型;
prompt: 提示词,交互信息
stream: 是否以流的形式返回

在这里插入图片描述
在这里插入图片描述
2、通过测试发现1.5b 版本的效果不尽如人意,所以建议如果自己机器性能如果可以的话,可以考虑下载高版本的。我自己电脑配置为12G 的内存,测试 1.5b 时比较困难,大家可以参考下。
3、ollama不仅可以部署 deepseek,还可以选择其他大模型,感兴趣的可以试试。

相关文章:

  • DRF框架中viewsets.ModelViewSet、APIView区别与联系
  • 八大元素定位
  • TRELLIS 部署笔记
  • 高速硬件电路设计
  • 基于阿里云调用deepseek大模型
  • 如何搭建同城O2O服务平台?AI外卖跑腿APP技术革新与开发实践
  • 【Java基础】Java数组
  • 深圳SMT贴片加工厂家核心技术及服务优势解析
  • mybatis使用typeHandler实现类型转换
  • elabradio入门第三讲——PSK传输系统的载波同步
  • maya创建文字模型
  • 深入理解 Java 反射机制:获取类信息与动态操作
  • Windows 环境下 Grafana 安装指南
  • C++接口继承和实现继承
  • 观察者模式原理详解以及Spring源码如何使用观察者模式?
  • ChatGLM
  • 前端函数在开发环境与生产环境中处理空字符串的差异及解决方案
  • 为什么WP建站更适合于谷歌SEO优化?
  • Mathtype安装入门指南
  • WPF9-数据绑定进阶
  • 明星同款撕拉片,为何能炒到三四百一张?
  • 壹基金发布2024年度报告,公益项目惠及937万人次
  • 阿里CEO:将以饱和式投入打法,聚焦几大核心战役
  • 巴基斯坦信德省首府卡拉奇发生爆炸
  • 太原一高中生指出博物馆多件藏品标识不当,馆方已邀请他和专家共同探讨
  • 酒店取消订单加价卖何以屡禁不绝?专家建议建立黑名单并在商家页面醒目标注