当前位置: 首页 > news >正文

模型 - Qwen 2.5

在这里插入图片描述

文章目录

    • Qwen 2.5
    • 通义千问 (Qwen) 整体
      • 专有版本
      • 开源模型


Qwen 2.5

  • 提供 0.5B 、1.5B 、3B 、7B 、14B 、32B 和 72B 共7种参数规模的模型
    有 基模型 和 指令微调模型 两种变体(其中“ B ”表示“十亿”, 72B 即为 720 亿)
  • 具备能力:自然语言理解、文本生成、视觉理解、音频理解、工具使用、角色扮演、作为AI Agent 进行互动等多种能力。
  • 支持 29 种语言

  • Qwen 官方文档:https://qwen.readthedocs.io/zh-cn/latest/
  • 博客:https://qwenlm.github.io/
  • GitHub : https://github.com/QwenLM
  • Hugging Face : https://huggingface.co/Qwen
  • ModelScope : https://modelscope.cn/organization/qwen
  • HF - Qwen2.5 Collection : https://huggingface.co/collections/Qwen/qwen25-66e81a666513e518adb90d9e

通义千问 (Qwen) 整体

通义千问(英文: Qwen ;读作: kùn)是由阿里巴巴通义千问团队开发的大规模语言和多模态系列模型。
通义千问可以执行自然语言理解、文本生成、视觉理解、音频理解、工具调用、角色扮演、智能体等多种任务。
语言和多模态模型均在大规模、多语言、多模态数据上进行预训练,并在高质量语料上后训练以与人类偏好对齐。


有专有版本和开放权重版本。

专有版本

  • 通义千问 (Qwen):语言模型
    • Qwen Max
    • Qwen Plus
    • Qwen Turbo
  • 通义千问 VL (Qwen-VL): 视觉语言模型
    • Qwen-VL Max
    • Qwen-VL Plus
    • Qwen-VL OCR
  • 通义千问 Audio: 音频语言模型
    • Qwen-Audio Turbo
    • Qwen-Audio ASR

更多信息可见 Alibaba Cloud Model Studio (China Site [zh], International Site).


开源模型

包括:

  • 通义千问 (Qwen):语言模型
    • Qwen: 1.8B、 7B、 14B 及 72B 模型
    • Qwen1.5: 0.5B、 1.8B、 4B、 14BA2.7B、 7B、 14B、 32B、 72B 及 110B 模型
    • Qwen2: 0.5B、 1.5B、 7B、 57A14B 及 72B 模型
    • Qwen2.5: 0.5B、 1.5B、 3B、 7B、 14B、 32B 及 72B 模型
  • 通义千问 VL (Qwen-VL): 视觉语言模型
    • Qwen-VL: 基于 7B 的模型
    • Qwen-VL: 基于 2B 、 7B 和 72B 的模型
  • 通义千问 Audio: 音频语言模型
    • Qwen-Audio: 基于 7B 的模型
    • Qwen2-Audio: 基于 7B 的模型
  • Q*Q: the reasoning models
    • QwQ-Preview: 32B LLM
    • QVQ-Preview: 72B VLM
  • Code通义千问 / 通义千问Coder:代码语言模型
    • CodeQwen1.5: 7B 模型
    • Qwen2.5-Coder: 0.5B, 1.5B, 3B, 7B, 14B, and 32B models
  • 通义千问 Math:数学语言模型
    • Qwen2-Math: 1.5B、 7B 及 72B 模型
    • Qwen2.5-Math: 1.5B、 7B 及 72B 模型
  • Qwen-Math-RM: the reward models for mathematics
    • Qwen2-Math-RM: 72B models
    • Qwen2.5-Math-RM: 72B models
    • Qwen2.5-Math-PRM: 7B and 72B models

2025-03-06(四)

相关文章:

  • 深度学习模型Transformer初步认识整体架构
  • 《几何原本》命题I.16
  • 江科大51单片机笔记【10】蜂鸣器(上)
  • char int string 的互相转换
  • 国产化替换案例:CACTER邮件网关为Groupwise系统加固邮件安全防线
  • Shell 编程中 `$?` 的陷阱:基于一个性别判断的例子
  • c++全排列
  • 97k倍区间
  • Windows编译环境搭建(MSYS2\MinGW\cmake)
  • Kubermetes 部署mysql pod
  • osg官方例子
  • 【大模型理论篇】--Mixture of Experts架构
  • 【操作系统】进程、线程、作业
  • 《DataWorks 深度洞察:量子机器学习重塑深度学习架构,决胜复杂数据战场》
  • BUUCTF逆向刷题笔记(1-12)
  • Scala的模式匹配
  • upload-labs靶场 1-21通关
  • 记录一次miniconda+openwebui迁移
  • Redis系列之慢查询分析与调优
  • api测试工具(postman、apifox、apipost)
  • 毕业设计代做网站/百度快照怎么发布
  • 鸿蒙最新版本/有没有免费的seo网站
  • 武汉市江汉区疫情最新消息/电脑系统优化软件十大排名