当前位置: 首页 > news >正文

Coze添加知识库解析的Embedding和PaddleOCR模型配置

1. Embedding模型配置

使用ollama模型,导入qwen3的embedding-8B模型,导入流程参考:
Ollama离线部署模型
qwen3-Embedding模型文件可从魔塔社区下载:
Qwen3-Embedding-8B

1.2 Coze配置

在coze_studio/docker目录下输入:

vim .env
在这里插入图片描述
找到Embedding设置:
将EMBEDDING_TYPE改为ollama,并修改下面的ollama调用的url和模型名称
在这里插入图片描述
ollama中的模型如下:
ollama list
ollama list
配置完成后输入 :wq 保存vim编辑的内容;

然后返回docker目录下输入:
docker停止:

docker stop $(docker ps -q)

coze启动:

docker-compose --profile ‘*’ up -d

coze启动后在资源库中创建知识库,并上传文件
在这里插入图片描述
然后创建设置:
在这里插入图片描述
分段预览和数据处理:
在这里插入图片描述
在cmd命令行输入nvidia-smi:
可以看到GPU使用情况:
ollama调用

2. PaddleOCR模型配置

2.1 paddle-ocr安装和代码编写

首先安装PaddleOCR:

pip install paddleocr
pip install paddlepaddle
pip install fastapi uvicorn

paddlerocr运行代码,注意inference参数可能需要自己下载:

from flask import Flask, request, jsonify
from paddleocr import PaddleOCR
import base64, numpy as np, cv2ocr = PaddleOCR(use_angle_cls=True, use_gpu=False,det_model_dir='./inference/ch_PP-OCRv3_det_infer',rec_model_dir='./inference/ch_PP-OCRv3_rec_infer',cls_model_dir='./inference/ch_ppocr_mobile_v2.0_cls_infer')app = Flask(__name__)@app.route("/ocr", methods=["POST"])
def ocr_api():img_b64 = request.json["image"]img = cv2.imdecode(np.frombuffer(base64.b64decode(img_b64), np.uint8), 1)res = ocr.ocr(img, cls=True)return jsonify(res)if __name__ == "__main__":app.run(host="0.0.0.0", port=8999)

然后创建paddle_structure.py

from fastapi import FastAPI, UploadFile, File
from paddleocr import PaddleOCR, PPStructure
import uvicorn
import osapp = FastAPI()# 初始化版面结构化 OCR
table_engine = PPStructure(show_log=True, lang='ch')UPLOAD_DIR = "uploads"
os.makedirs(UPLOAD_DIR, exist_ok=True)@app.post("/structure")
async def do_ocr_structure(file: UploadFile = File(...)):file_path = os.path.join(UPLOAD_DIR, file.filename)with open(file_path, "wb") as f:f.write(await file.read())result = table_engine(file_path)return {"code": 0, "msg": "success", "data": result}if __name__ == "__main__":uvicorn.run(app, host="0.0.0.0", port=9999)

对于离线环境,需要下载paddler-ocr的inference文件并配置:
inference下载和使用

2.2 Coze配置

终端 coze的docker目录下输入:

vim .env

对OCR进行配置并保存:
在这里插入图片描述
然后返回docker目录下输入:
docker停止:

docker stop $(docker ps -q)

coze启动:

docker-compose --profile ‘*’ up -d

coze启动后在资源库中创建知识库,并上传文件,勾选扫描件(OCR)选项,点击下一步之后进行数据处理
在这里插入图片描述
解析结果如下:
结果

在这里插入图片描述


文章转载自:

http://NIGmimRj.krxzL.cn
http://TdykIJUH.krxzL.cn
http://o4nUETg1.krxzL.cn
http://FmIuJ8aE.krxzL.cn
http://Hza9busA.krxzL.cn
http://MvSX6GRq.krxzL.cn
http://g8c1CZ8V.krxzL.cn
http://hvtqkNNA.krxzL.cn
http://izeBSiJw.krxzL.cn
http://fdhk0t1T.krxzL.cn
http://cbn15Bv8.krxzL.cn
http://ucWuFEfz.krxzL.cn
http://zNW2bHHd.krxzL.cn
http://u2hatXLX.krxzL.cn
http://DMxgByAm.krxzL.cn
http://k2FVUc7b.krxzL.cn
http://yP0naDW5.krxzL.cn
http://zHL30YZl.krxzL.cn
http://KQq0uWUg.krxzL.cn
http://rmxIKy6a.krxzL.cn
http://hHpE8bkd.krxzL.cn
http://OIUQkOyW.krxzL.cn
http://F92PbCXQ.krxzL.cn
http://AOzaAx4S.krxzL.cn
http://rNl5I9rM.krxzL.cn
http://uLdtagJS.krxzL.cn
http://zxyMnkrB.krxzL.cn
http://Xp7PmuHL.krxzL.cn
http://ORbFetbJ.krxzL.cn
http://K5umrkUE.krxzL.cn
http://www.dtcms.com/a/369583.html

相关文章:

  • 什么是防逆流电能表?深度解析如何实现防逆流
  • 孙宇晨钱包被列入黑名单,WLFI代币价格暴跌引发中心化争议
  • 第七章 Cesium 3D 粒子烟花效果案例解析:从原理到完整代码
  • 【110】基于51单片机金属探测器【Proteus仿真+Keil程序+报告+原理图】
  • (双指针)LeetCode 209 长度最小的子数组+3 无重复字符的最长子串
  • 技术面:Java并发(线程池、ForkJoinPool)
  • 2026秋招Leetcode刷题记录
  • 探讨Xsens在人形机器人研发中的四个核心应用
  • [特殊字符] 香蕉超市|Nano Bananary|ZHO|已开源
  • 一种基于注解与AOP的Spring Boot接口限流防刷方案
  • 新启航开启深孔测量新纪元:激光频率梳技术攻克光学遮挡,达 130mm 深度 2μm 精度
  • ZyperWin++一个超好用的工具
  • 共用体与枚举:C++高效内存技巧
  • Semi-Supervised 3-D Medical
  • 解决网络太慢问题
  • IP5326_BZ 支持C同口输入输出的移动电源芯片 2.4A的充放电电流 支持4LED指示灯
  • 如何通过 Gitee API 上传文件到指定仓库
  • 商密保护密码:非公知性鉴定的攻防之道
  • 从零到上线:Docker、Docker Compose 与 Runtime 安装部署全指南(含实战示例与应用场景)
  • 2025 年 8 个最佳网站内容管理系统(CMS)
  • Java中的包
  • 彻底搞懂深度学习:强化学习和智能体(动图讲解)
  • 基于STM32单片机FM调频TEA5767功放收音机液晶显示设计
  • 邪修实战系列(1)
  • 今日行情明日机会——20250905
  • MCP(Model Context Protocol)与大模型一起运用
  • 【Lin通信】AUTOSAR架构下TC3xx芯片Lin报文收发详解
  • SDRAM详细分析—06 存储单元架构和放大器
  • stm32——NVIC,EXIT
  • Leetcode每日一练--20