【评测】Qwen3-embedding 0.6B和8B召回效果评估
回到目录
【评测】Qwen3-embedding 0.6B和8B召回效果评估
0. 前置知识:
1. 【部署】dify+ollama部署Qwen3-Embedding-8B
2. 【部署】读取制度类txt文件导入dify的父子分段知识库
1. 同一份文档分别使用0.6B和8B建立两套知识库, 其他配置参数一致且topK设置5
1.1. Regulation-IT知识库使用8B模型
[pic01]
1.2. Regulation-IT知识库使用0.6B模型
[pic02]
2. 召回效果对比
使用同一个提示词“渗透测试工作流程是怎样的”
2.1. 8B召回4段
[pic03]
2.2. 0.6B召回5段
[pic04]
3. 结合Qwen3-8B看一下总结效果
3.1. 8B问题解答效果不错
[pic05]
3.2. 0.6B问题解答效果同样不错
[pic06]
本文结束
回到目录