当前位置: 首页 > news >正文

大模型系列-dify

大模型系列-dify

      • 1. 批量添加分段

1. 批量添加分段

把excel里面的Q/A内容批量插入知识库,代码的方式插入有知识库,其中问题整理.xlsxexcel文件格式为问题、答案两列:格式如下:
问题1 答案1
问题2 答案2

import requests
import json
import pandas as pd# pip install pandas openpyxldef send_post_request(document_id="9e1538d6-1e14-4543-b49f-e890154b0737", question="你好", answer="你好!"):# 请求URLurl = "http://ip:port/console/api/datasets/075ecd79-b1a5-4d2e-a466-2012c0dda14c/documents/9e1538d6-1e14-4543-b49f-e890154b0737/segment"# 请求头token = "eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJ1c2VyX2lkIjoiMzhmMzE1M2YtZDhiOS00MTgxLWI0ZmItZjU2MzdkMGU0Mzk5IiwiZXhwIjoxNzYwNDI2NjU1LCJpc3MiOiJTRUxGX0hPU1RFRCIsInN1YiI6IkNvbnNvbGUgQVBJIFBhc3Nwb3J0In0.F62P8qvUvC_bAxc_9KjQNcFN3ucyiB3Bi_fZL_Q_KKA"headers = {# 2. 确保Bearer后面有空格,格式正确"Authorization": f"Bearer {token}","Content-Type": "application/json"}# 请求数据data = {"id": "5d640c23-1495-4751-aea7-554fc588df31","position": 5,"document_id": document_id,"content": question,"sign_content": "c","answer": answer,"word_count": 2,"tokens": 1,"keywords": None,"index_node_id": "f029fc4b-6014-4373-a89a-6faa4f700f78","index_node_hash": "2f7cfb4fa6fef769c6daff15772f3b1193b19b20d7a1534ca6d2542658ec69e5","hit_count": 0,"enabled": True,"disabled_at": None,"disabled_by": None,"status": "completed","created_by": "38f3153f-d8b9-4181-b4fb-f5637d0e4399","created_at": 1760422745,"updated_at": 1760422745,"updated_by": None,"indexing_at": 1760422745,"completed_at": 1760422745,"error": None,"stopped_at": None,"child_chunks": []}try:# 发送POST请求response = requests.post(url, headers=headers, json=data)# 检查响应状态码response.raise_for_status()# 打印响应内容print("请求成功!")print("响应状态码:", response.status_code)print("响应内容:", json.dumps(response.json(), indent=2, ensure_ascii=False))return response.json()except requests.exceptions.RequestException as e:print(f"请求失败: {e}")return Nonedef batch_insert():# 读取Excel文件file_path = '/home/geekplusa/ai/projects/data/问题整理.xlsx'df = pd.read_excel(file_path, sheet_name='内部知识库')# 初始化结果列表qa_list = []# 遍历每一行for index, row in df.iterrows():question = row.iloc[0]  # 第二列是问题answer = row.iloc[1]  # 第三列是答案send_post_request(question=question, answer=answer)print(f"问题: {question}, 答案: {answer}")if __name__ == "__main__":batch_insert()
http://www.dtcms.com/a/482704.html

相关文章:

  • 推荐系统:Python汽车推荐系统 数据分析 可视化 协同过滤推荐算法 汽车租赁 Django框架 大数据 计算机✅
  • 第16讲:深入理解指针(6)——sizeof vs strlen 与 指针笔试题深度解析
  • 【iOS】PrivacyInfo.xcprivacy隐私清单文件(二)
  • 环保网站建设公司排名手机访问wordpress网站卡
  • 从零构建大模型 Build a large language model from scratch by Sebastian Raschka 阅读笔记
  • 基于Chainlit和Llamalndex的智能RAG聊天机器人实现详解
  • 18.5 GLM-4大模型私有化部署实战:3秒响应+显存降低40%优化全攻略
  • Prisma 命令安全指南
  • Linux系统下文件操作系统调用详解
  • 网站备案后需要年检吗官方网站搭建
  • 515ppt网站建设北京朝阳区属于几环
  • 5~20.数学基础
  • HTML应用指南:利用POST请求获取全国鸿蒙智行门店位置信息
  • 优先级队列(堆)-295.数据流的中位数-力扣(LeetCode)
  • 大语言模型推理本质与技术演进
  • 福田区网站建最牛视频网站建设
  • 踩坑实录:Go 1.25.x 编译的 exe 在 Windows 提示“此应用无法运行”
  • 学习网站建设有前景没wordPress登不上数据库
  • 互联网大厂Java面试:从缓存技术到安全框架的深度探索
  • 本地部署开源集成工具 Jenkins 并实现外网访问( Linux 版本)
  • HackerNews 播客生成器
  • 新网站优化品牌营销策略四种类型
  • Linux 命令:umount
  • springboot159基于springboot框架开发的景区民宿预约系统的设计与实现
  • LatchUtils:简化Java异步任务同步的利器
  • 数据库设计基础知识(3)关系运算
  • uniapp 编译支付宝小程序canvas 合成图片实例,支付宝小程序 canvas 渲染图片 可以换成自己的图片即可
  • jmeter环境搭建
  • 专业的免费网站建设网站开发怎么销售
  • 浙江网站建设cms免费无限建站