当前位置: 首页 > news >正文

dify + deepseek /qwen + win +xinference 等完成知识库建设

Dify.AI · The Innovation Engine for Generative AI Applications

简介:Dify是一个用于构建人工智能应用程序的开源平台。我们将后端即服务和LLMOps相结合,简化了生成式人工智能解决方案的开发,使开发人员和非技术创新者都可以使用。CPU>=2核 RAM>=4Gib

安装dify之前需要先安装docker、git,可以一键搭建dify

ps:本博客 注重的是安装的过程,中间的一些使用说明可以通过本博客跳转

1.安装dify

       1) 获取安装信息


            a) 使用git拉取dify源码
                  git pull https://github.com/langgenius/dify

国内网络比较卡 可能需要多次刷新

                git安装教程可参考:本地安装git-CSDN博客


           b) Dify安装包
                解压可用 dify-main.zip

     2) 修改配置

cp dify-main\docker\.env.example -> dify-main\docker\.env

因本地还部署了RAGFlow所以修改了这个端口,默认可不修改

3)  使用docker部署

cd D:\python\dify-main\docker  -- 到dify目录下

docker compose up -d

docker 安装教程:本地安装docker-CSDN博客

安装成功后,启动docker后则启动

首次登录的用户账号 则被认定为管理员账号

 进入后可进行dify的一些参数配置 创建机器人 知识库等信息

2. dify 使用 基础使用

 参考博客: dify(docker deepseek xinference) 机器人的操作 -CSDN博客

3. xinference -rerank模型

Xinference 是一个开源的分布式模型推理框架,旨在简化大规模AI模型的部署和加速推理过程。它由专注于AI技术的公司 Xorbits Inc. 开发,支持多种模型类型(如大语言模型、语音识别模型、多模态模型等),并通过优化计算资源和硬件加速技术,显著提升模型性能。

                在dify中 如果要使用rerank模型进行重排序二次检索得到更精确的数据 则需要在安装xinference

安装命令:

docker run  -d  --name xinference --gpus all  -v D:/python/xinfore/models:/root/models  -v D:/python/xinfore/.xinference:/root/.xinference -v D:/python/xinfore/.cache/huggingface:/root/.cache/huggingface -e XINFERENCE_HOME=/root/models  -p 9997:9997  registry.cn-hangzhou.aliyuncs.com/xprobe_xinference/xinference:latest  xinference-local -H 0.0.0.0

安装成功后: 管理界面

点击lunch 小飞机后,安装

安装成功后 在dify即可使用xinference.

相关文章:

  • STM32 IIC通信
  • 从春招“AI热潮”看科技变革中的就业新趋势
  • 学习不同电脑cpu分类及选购指南
  • 【Linux-驱动开发-pinctrl子系统】
  • AI大模型从0到1记录学习 day08
  • Django:构建高性能Web应用
  • 国内GitHub镜像源全解析:加速访问与替代方案指南
  • Spring @EnableAutoConfiguration 注解执行过程详解
  • 卷积神经网络在图像分割中的应用:原理、方法与进展介绍
  • 如何使用 GPT-4o API 实现视觉、文本、图像等功能 附赠gpt升级和4o额度购买
  • Matlab设置表table的表头
  • 为什么使用Flask + uWSGI + Nginx 部署服务?
  • 硬件基础--14_电功率
  • Transformers中的BertConfig、BertModel详解
  • 蓝桥杯备考:贪心问题之均分纸牌
  • 【2.项目管理】2.4 Gannt图【甘特图】
  • 【Python】类定义过程中 列表推导式获取类变量的问题
  • Oracle 23ai Vector Search 系列之2 ONNX(Open Neural Network Exchange)
  • Webpack 配置详解:从入门到实战
  • 复习MySQL20250327
  • 成都警方通报:8岁男孩落水父母下水施救,父亲遇难
  • 英国首相斯塔默住所起火,警方紧急调查情况
  • 这些网红果蔬正在收割你的钱包,营养师:吃了个寂寞
  • 政策一视同仁引导绿色转型,企业战略回应整齐划一?
  • 中国科协发声:屡禁不止的奇葩论文再次敲响学风建设警钟
  • 1450亿元!财政部拟发行2025年中央金融机构注资特别国债(二期)