当前位置：首页 > news >正文

Coze添加知识库解析的Embedding和PaddleOCR模型配置

news 2025/9/6 15:28:28

1. Embedding模型配置

使用ollama模型，导入qwen3的embedding-8B模型，导入流程参考：
Ollama离线部署模型
qwen3-Embedding模型文件可从魔塔社区下载：
Qwen3-Embedding-8B

1.2 Coze配置

在coze_studio/docker目录下输入:

vim .env

找到Embedding设置：
将EMBEDDING_TYPE改为ollama，并修改下面的ollama调用的url和模型名称

ollama中的模型如下：
ollama list

配置完成后输入 :wq 保存vim编辑的内容;

然后返回docker目录下输入：
docker停止：

docker stop $(docker ps -q)

coze启动:

docker-compose --profile ‘*’ up -d

coze启动后在资源库中创建知识库，并上传文件
在这里插入图片描述
然后创建设置：

分段预览和数据处理：

在cmd命令行输入nvidia-smi：
可以看到GPU使用情况:
ollama调用

2. PaddleOCR模型配置

2.1 paddle-ocr安装和代码编写

首先安装PaddleOCR:

pip install paddleocr
pip install paddlepaddle
pip install fastapi uvicorn

paddlerocr运行代码,注意inference参数可能需要自己下载:

from flask import Flask, request, jsonify
from paddleocr import PaddleOCR
import base64, numpy as np, cv2ocr = PaddleOCR(use_angle_cls=True, use_gpu=False,det_model_dir='./inference/ch_PP-OCRv3_det_infer',rec_model_dir='./inference/ch_PP-OCRv3_rec_infer',cls_model_dir='./inference/ch_ppocr_mobile_v2.0_cls_infer')app = Flask(__name__)@app.route("/ocr", methods=["POST"])
def ocr_api():img_b64 = request.json["image"]img = cv2.imdecode(np.frombuffer(base64.b64decode(img_b64), np.uint8), 1)res = ocr.ocr(img, cls=True)return jsonify(res)if __name__ == "__main__":app.run(host="0.0.0.0", port=8999)

然后创建paddle_structure.py

from fastapi import FastAPI, UploadFile, File
from paddleocr import PaddleOCR, PPStructure
import uvicorn
import osapp = FastAPI()# 初始化版面结构化 OCR
table_engine = PPStructure(show_log=True, lang='ch')UPLOAD_DIR = "uploads"
os.makedirs(UPLOAD_DIR, exist_ok=True)@app.post("/structure")
async def do_ocr_structure(file: UploadFile = File(...)):file_path = os.path.join(UPLOAD_DIR, file.filename)with open(file_path, "wb") as f:f.write(await file.read())result = table_engine(file_path)return {"code": 0, "msg": "success", "data": result}if __name__ == "__main__":uvicorn.run(app, host="0.0.0.0", port=9999)

对于离线环境，需要下载paddler-ocr的inference文件并配置:
inference下载和使用

2.2 Coze配置

终端 coze的docker目录下输入:

vim .env

对OCR进行配置并保存：
在这里插入图片描述
然后返回docker目录下输入：
docker停止：

docker stop $(docker ps -q)

coze启动:

docker-compose --profile ‘*’ up -d

coze启动后在资源库中创建知识库，并上传文件，勾选扫描件(OCR)选项,点击下一步之后进行数据处理
在这里插入图片描述
解析结果如下:

在这里插入图片描述

文章转载自：

http://NIGmimRj.krxzL.cn
http://TdykIJUH.krxzL.cn
http://o4nUETg1.krxzL.cn
http://FmIuJ8aE.krxzL.cn
http://Hza9busA.krxzL.cn
http://MvSX6GRq.krxzL.cn
http://g8c1CZ8V.krxzL.cn
http://hvtqkNNA.krxzL.cn
http://izeBSiJw.krxzL.cn
http://fdhk0t1T.krxzL.cn
http://cbn15Bv8.krxzL.cn
http://ucWuFEfz.krxzL.cn
http://zNW2bHHd.krxzL.cn
http://u2hatXLX.krxzL.cn
http://DMxgByAm.krxzL.cn
http://k2FVUc7b.krxzL.cn
http://yP0naDW5.krxzL.cn
http://zHL30YZl.krxzL.cn
http://KQq0uWUg.krxzL.cn
http://rmxIKy6a.krxzL.cn
http://hHpE8bkd.krxzL.cn
http://OIUQkOyW.krxzL.cn
http://F92PbCXQ.krxzL.cn
http://AOzaAx4S.krxzL.cn
http://rNl5I9rM.krxzL.cn
http://uLdtagJS.krxzL.cn
http://zxyMnkrB.krxzL.cn
http://Xp7PmuHL.krxzL.cn
http://ORbFetbJ.krxzL.cn
http://K5umrkUE.krxzL.cn

http://www.dtcms.com/a/369583.html

相关文章：

什么是防逆流电能表？深度解析如何实现防逆流

孙宇晨钱包被列入黑名单，WLFI代币价格暴跌引发中心化争议

第七章 Cesium 3D 粒子烟花效果案例解析：从原理到完整代码

【110】基于51单片机金属探测器【Proteus仿真+Keil程序+报告+原理图】

(双指针）LeetCode 209 长度最小的子数组+3 无重复字符的最长子串

技术面：Java并发（线程池、ForkJoinPool）

2026秋招Leetcode刷题记录

探讨Xsens在人形机器人研发中的四个核心应用

[特殊字符] 香蕉超市｜Nano Bananary｜ZHO｜已开源

一种基于注解与AOP的Spring Boot接口限流防刷方案

新启航开启深孔测量新纪元：激光频率梳技术攻克光学遮挡，达 130mm 深度 2μm 精度

ZyperWin++一个超好用的工具

共用体与枚举：C++高效内存技巧

Semi-Supervised 3-D Medical

解决网络太慢问题

IP5326_BZ 支持C同口输入输出的移动电源芯片 2.4A的充放电电流支持4LED指示灯

如何通过 Gitee API 上传文件到指定仓库

商密保护密码：非公知性鉴定的攻防之道

从零到上线：Docker、Docker Compose 与 Runtime 安装部署全指南（含实战示例与应用场景）

2025 年 8 个最佳网站内容管理系统（CMS）

Java中的包

彻底搞懂深度学习：强化学习和智能体（动图讲解）

基于STM32单片机FM调频TEA5767功放收音机液晶显示设计

邪修实战系列（1）

今日行情明日机会——20250905

MCP（Model Context Protocol）与大模型一起运用

【Lin通信】AUTOSAR架构下TC3xx芯片Lin报文收发详解

SDRAM详细分析—06 存储单元架构和放大器

stm32——NVIC，EXIT

Leetcode每日一练--20