利用 Synonyms 中文近义词库调优 RAG 服务,基于 Ollama, DeepSeek R1, Langchain
目录
- 比对代码
- 对比结果
- Synonyms 中文近义词 Embeddings
- HuggingFaceEmbeddings
GitHub https://github.com/hailiang-wang/llm-get-started/tree/master/003_rag_langchain
本文介绍,在基于 RAG 服务实现问答的过程中,使用两种 Embeddings 模式下,处理中文 PDF 文件,推理结果的比对:
- HuggingFaceEmbeddings
- Synonyms 中文近义词 Embeddings
比对代码
作为比对,只是更新了 Embeddings 类,而其它代码均不变。这意味着,大模型、参数、知识库文件等都是相同的。
- HuggingFaceEmbeddings:LINK
- Synonyms 中文近义词 Embeddings: LINK
对比结果
PDF 文件中,有一些地方表明了项目的负责人是张笑,但是需要模型的推理能力才能回答。
- 结论:Synonyms 中文近义词 Embeddings RAG 准确回答了。HuggingFaceEmbeddings 没有回答出来。每个 RAG 服务的推理详情见下。Synonyms 中文近义词 Embeddings RAG 服务处理中文文档更胜一筹。
Synonyms 中文近义词 Embeddings
给出了正确答案:项目负责人是张笑。
HuggingFaceEmbeddings
未能给出准确答案。