当前位置: 首页 > wzjs >正文

上海企业建站提供商网站相应速度

上海企业建站提供商,网站相应速度,wordpress博客采集,郑州微信网站建设第一步,安装Ollama。打开官网下载:https://ollama.com/download 可以选择Download for Windows来下载。然后双击OllamaSetup.exe按提示安装完成。 第二步,打开Windows PowerShell,或者CMD命令。 如下载Qwen3-Embedding-0.6B&am…

第一步,安装Ollama。打开官网下载:https://ollama.com/download

可以选择Download for Windows来下载。然后双击OllamaSetup.exe按提示安装完成。

第二步,打开Windows PowerShell,或者CMD命令。

如下载Qwen3-Embedding-0.6B,可以输入Ollama命令:

ollama run dengcao/Qwen3-Embedding-0.6B:F16

如下载Qwen3-Reranker-0.6B,可以输入Ollama命令:

ollama run dengcao/Qwen3-Reranker-0.6B:F16

接下来等待下载完成即可。

下面列出Qwen3-Embedding和Qwen3-Reranker各个版本的Ollama安装命令。

Qwen3-Embedding-0.6B系列:

ollama run dengcao/Qwen3-Embedding-0.6B:Q8_0

ollama run dengcao/Qwen3-Embedding-0.6B:F16

Qwen3-Embedding-4B系列:

ollama run dengcao/Qwen3-Embedding-4B:Q4_K_M

ollama run dengcao/Qwen3-Embedding-4B:Q5_K_M

ollama run dengcao/Qwen3-Embedding-4B:Q8_0

Qwen3-Embedding-8B系列:

ollama run dengcao/Qwen3-Embedding-8B:Q4_K_M

ollama run dengcao/Qwen3-Embedding-8B:Q5_K_M

ollama run dengcao/Qwen3-Embedding-8B:Q8_0

Qwen3-Reranker-0.6B系列:

ollama run dengcao/Qwen3-Reranker-0.6B:Q8_0

ollama run dengcao/Qwen3-Reranker-0.6B:F16

Qwen3-Reranker-4B系列:

ollama run dengcao/Qwen3-Reranker-4B:Q4_K_M

ollama run dengcao/Qwen3-Reranker-4B:Q5_K_M

ollama run dengcao/Qwen3-Reranker-4B:Q8_0

Qwen3-Reranker-8B系列:

ollama run dengcao/Qwen3-Reranker-8B:Q3_K_M

ollama run dengcao/Qwen3-Reranker-8B:Q4_K_M

ollama run dengcao/Qwen3-Reranker-8B:Q5_K_M

ollama run dengcao/Qwen3-Reranker-8B:Q8_0

关于量化版本的说明:

q8_0:与浮点数16几乎无法区分。资源使用率高,速度慢。不建议大多数用户使用。

q6_k:将Q8_K用于所有张量。

q5_k_m:将 Q6_K 用于一半的 attention.wv 和 feed_forward.w2 张量,否则Q5_K。

q5_0: 原始量化方法,5位。精度更高,资源使用率更高,推理速度更慢。

q4_k_m:将 Q6_K 用于一半的 attention.wv 和 feed_forward.w2 张量,否则Q4_K

q4_0:原始量化方法,4 位。

q3_k_m:将 Q4_K 用于 attention.wv、attention.wo 和 feed_forward.w2 张量,否则Q3_K

q2_k:将 Q4_K 用于 attention.vw 和 feed_forward.w2 张量,Q2_K用于其他张量。

根据经验,建议使用 Q5_K_M,因为它保留了模型的大部分性能。或者,如果要节省一些内存,可以使用 Q4_K_M。

Qwen3深夜上新,Embedding系列和Reranker系列全新登场!

它专为文本表征、检索与排序任务设计,旨在将文本(如句子、段落)转换为高质量的向量表示,以便在语义搜索、问答系统、推荐引擎等应用中更有效地处理和理解自然语言。

可用于文档检索、RAG、分类、情感分析、检索等任务。

它在Qwen3基础模型上训练而来,充分发挥Qwen3的多语言优势。

一共有0.6B/4B/8B三种尺寸,8B版本在MTEB多语言Leaderboard榜单中排名第一,性能超越一众商业API服务。

http://www.dtcms.com/wzjs/554141.html

相关文章:

  • 企业网站建设营销优化方案wordpress php5.3.5访问慢
  • 中文企业网站设计欣赏中国建筑官网电话
  • 网页设计网站教程html怎么做网站地图
  • 免费做相册视频网站怎样在网站做宣传
  • 做网站主页网站被百度蜘蛛爬死了
  • 新网站如何才做被百度收录保定seo博客
  • 泉州网站建设 首选猴子网络石家庄网络公司哪家正规
  • 宁波做网站烟台厂商手机网站定制咨询
  • wordpress中菜单唐山seo
  • 搞个网站要多少钱vps做网站
  • 建一个网站需要多长时间运营管理培训
  • 器材管理网站开发福州网站设计哪家做的好
  • 智威汤逊广告公司东莞网站优化
  • 网络公司网站程序电商网站开发要多少钱
  • 淄博网泰专业做网站黄金网站
  • 企业建设网站公司有哪些zencart添加wordpress
  • 网站建设原型动态型网站建设哪里便宜
  • 网站设置仅某浏览器什么网站可以做设计赚钱
  • 设计微信网站建设做视频网站 视频放在哪
  • 上海搜索排名优化公司网络seo
  • 网站获取qq号码 代码WordPress 主页缩略图链接
  • 连云制作企业网站网站地址格式
  • 网站在哪里备案信息上海缔客网站建设公司
  • 青村网站建设巩义网站建设模板
  • 太湖县住房与建设局网站网页美工设计需要学什么
  • 大连市城乡建设厅网站海南直聘网
  • 网站建设优化公司哪家好修改 wordpress footer
  • 亚马逊网站建设做什么如何看一个网站是用哪个语言做的
  • 企业网站硬件设计用wordpress做的博客
  • 如何建设数据报表网站网站服务器ip地址怎么查