当前位置: 首页 > wzjs >正文

网站建设了解最新新闻事件

网站建设了解,最新新闻事件,南阳教育论坛网站建设,网站建设属于什么费用【大模型:知识库管理】--开源工具Ragflow介绍本地搭建-CSDN博客 目录 1.启动ragflow 2.创建知识库 2.1.配置--切块方法 2.2.上传知识库文件 2.3.运行检索测试 2.4.配置本地对话模型 1.启动ragflow docker compose up -d docker logs -f ragflow-server 2.创建知识库 2.…

【大模型:知识库管理】--开源工具Ragflow介绍+本地搭建-CSDN博客

目录

1.启动ragflow

2.创建知识库

2.1.配置--切块方法

2.2.上传知识库文件

2.3.运行检索测试

2.4.配置本地对话模型


1.启动ragflow

docker compose up -d
docker logs -f ragflow-server

2.创建知识库

2.1.配置--切块方法

先配置:

 

1.知识库名称:Rag_test

2.权限:只有我

3.PDF解析器:选用DeepDoc(Naive不好用)

4.嵌入模型:千问的

5.切块方法:

模板 (Template)描述 (Description)文件格式 (File Formats)
常规 (General)

1.系统将使用视觉检测模型将连续文本分割成多个片段。

2.接下来,这些连续的片段被合并成Token数不超过“Token数”的块。

DOCX、XLSX、XLS (Excel 97-2003)、PPT、PDF、TXT、JPEG、JPG、PNG、TIF、GIF、CSV、JSON、EML、HTML
问答 (Q&A)问答对,两列EXCEL, CSV/TXT

简历(Resume)

将简历解析为结构化数据DOCXPDFTXT
手册 (Manual)使用最低的部分标题作为对文档进行切片的枢轴。 因此,同一部分中的图和表不会被分割,PDF
表格 (Table)

对于 csv 或 txt 文件,列之间的分隔符TAB。

  • 第一行必须是列标题。
EXCEL, CSV/TXT
论文 (Paper)LLM可以更好的概括论文中相关章节的内容,PDF
书本 (Book)请为每本书设置页面范围DOCX, PDF, TXT
法律 (Legal)使用文本特征来检测分割点DOCX, PDF, TXT
ppt (Presentation)每个页面都将被视为一个块。 并且每个页面的缩略图都会被存储。PDF, PPTX
(Tag)

标签集独立存在​​,仅供其他知识库匹配使用。文件格式严格​​:XLSX 需两列无标题CSV/TXT 需 TAB 分隔 + 逗号分隔标签。

容错机制​​:非法格式数据自动跳过,避免污染标签集。

JPEG, JPG, PNG, TIF, GIF
唯一 (one)整个文档被分成唯一块。DOCX, EXCEL, PDF, TXT

2.2.上传知识库文件

我i这里上传了deepseek-v3的论文翻译(53页),试试分快的情况。

鼠标放到进度条上面可以看到具体的解析过程:

等几分钟:

2.3.运行检索测试

RAGFlow 在其聊天中使用全文搜索和矢量搜索的多次调用。在设置 AI 聊天之前,请考虑调整以下参数以确保预期信息始终出现在答案中:

  • 相似度阈值:相似度低于阈值的数据块将被过滤。默认设置为 0.2。
  • 向量相似度权重:向量相似度占总分的百分比。默认设置为 0.3。

2.4.配置本地对话模型

 在聊天页面增加一个聊天助手:

简单配置一下参数(可以使用默认)

默认提示词:

你是一个智能助手,请总结知识库的内容来回答问题,
请列举知识库中的数据详细回答。当所有知识库内容都与问题无关时,
你的回答必须包括“知识库中未找到您要的答案!”这句话。回答需要考虑聊天历史。以下是知识库:{knowledge}以上是知识库。

 模型参数:

  1. Model :选择 Chat (对话) 模型。尽管您在系统模型设置中选择了默认聊天模型,但 RAGFlow 允许您为对话选择替代聊天模型,选择正确的对话模型十分重要,这个影响到系统能否正常运行,如果对话模型配置错误,将导致不能输出正确的对话内容。
  2. Freedom:指 LLM 即兴创作的级别。从 Improvise、Precise 到 Balance,每个自由度级别都对应于 Temperature、Top P、Presence Penalty 和 Frequency Penalty 的独特组合。
  3. Temperature: LLM 的预测随机性水平。值越高,LLM 的创意就越大。
  4. Top P:也称为“细胞核采样”,选用默认值即可。
  5. Max Tokens:LLM 响应的最大长度。请注意,如果此值设置得太低,则响应可能会减少。

http://www.dtcms.com/wzjs/16501.html

相关文章:

  • 长沙seo推广营销简述seo的优化流程
  • 外贸公司做网站广告投放优化师
  • 广州微信网站产品线上推广渠道
  • 为什么大公司不用c 做网站自媒体营销代理
  • 外贸公司几个网站招代理最好的推广方式
  • wordpress 百度推荐优化关键词方法
  • 罗湖网站设计公司哪家好山西seo谷歌关键词优化工具
  • 杭州seo整站优化常用的seo工具
  • 建立网站不公开百度图片搜索网页版
  • 租房网站开发网站策划书案例
  • 网站开发技术流程陕西seo
  • 一个人日本免费完整版bdseo排名工具给您好的建议
  • 如何建立网站建设微信上如何投放广告
  • 河西做网站抖音seo优化怎么做
  • 青岛开发区网站建设公司域名解析查询工具
  • php做网站需要数据库吗网络营销培训班
  • 网络公司哪个最好seo排名点击器原理
  • 外贸网站建设平台怎样推广品牌
  • 在哪些网站上做推广好重庆seo公司
  • 网站后台管理界面下载网页设计模板免费网站
  • 可以建设网站整合营销是什么
  • 绿植行业做网站的百度推广天津总代理
  • 订餐网站模板下载网站设计开发网站
  • 互联网网站界面设计 要素如何优化网站快速排名
  • 微企点建好网站后要怎么做建站系统主要包括
  • 郑州做网站推广地play商店
  • 微信上怎么做网站链接搜索引擎优化网页
  • 服装网站建设项目规划书徐州seo培训
  • 广州市网站建设公司百度竞价冷门产品
  • 黄骅做网站公司网址有哪些