模型 - Qwen 2.5
文章目录
- Qwen 2.5
- 通义千问 (Qwen) 整体
- 专有版本
- 开源模型
Qwen 2.5
- 提供 0.5B 、1.5B 、3B 、7B 、14B 、32B 和 72B 共7种参数规模的模型
有 基模型 和 指令微调模型 两种变体(其中“ B ”表示“十亿”, 72B 即为 720 亿) - 具备能力:自然语言理解、文本生成、视觉理解、音频理解、工具使用、角色扮演、作为AI Agent 进行互动等多种能力。
- 支持 29 种语言
- Qwen 官方文档:https://qwen.readthedocs.io/zh-cn/latest/
- 博客:https://qwenlm.github.io/
- GitHub : https://github.com/QwenLM
- Hugging Face : https://huggingface.co/Qwen
- ModelScope : https://modelscope.cn/organization/qwen
- HF - Qwen2.5 Collection : https://huggingface.co/collections/Qwen/qwen25-66e81a666513e518adb90d9e
通义千问 (Qwen) 整体
通义千问(英文: Qwen ;读作: kùn)是由阿里巴巴通义千问团队开发的大规模语言和多模态系列模型。
通义千问可以执行自然语言理解、文本生成、视觉理解、音频理解、工具调用、角色扮演、智能体等多种任务。
语言和多模态模型均在大规模、多语言、多模态数据上进行预训练,并在高质量语料上后训练以与人类偏好对齐。
有专有版本和开放权重版本。
专有版本
- 通义千问 (Qwen):语言模型
- Qwen Max
- Qwen Plus
- Qwen Turbo
- 通义千问 VL (Qwen-VL): 视觉语言模型
- Qwen-VL Max
- Qwen-VL Plus
- Qwen-VL OCR
- 通义千问 Audio: 音频语言模型
- Qwen-Audio Turbo
- Qwen-Audio ASR
更多信息可见 Alibaba Cloud Model Studio (China Site [zh], International Site).
开源模型
包括:
- 通义千问 (Qwen):语言模型
- Qwen: 1.8B、 7B、 14B 及 72B 模型
- Qwen1.5: 0.5B、 1.8B、 4B、 14BA2.7B、 7B、 14B、 32B、 72B 及 110B 模型
- Qwen2: 0.5B、 1.5B、 7B、 57A14B 及 72B 模型
- Qwen2.5: 0.5B、 1.5B、 3B、 7B、 14B、 32B 及 72B 模型
- 通义千问 VL (Qwen-VL): 视觉语言模型
- Qwen-VL: 基于 7B 的模型
- Qwen-VL: 基于 2B 、 7B 和 72B 的模型
- 通义千问 Audio: 音频语言模型
- Qwen-Audio: 基于 7B 的模型
- Qwen2-Audio: 基于 7B 的模型
- Q*Q: the reasoning models
- QwQ-Preview: 32B LLM
- QVQ-Preview: 72B VLM
- Code通义千问 / 通义千问Coder:代码语言模型
- CodeQwen1.5: 7B 模型
- Qwen2.5-Coder: 0.5B, 1.5B, 3B, 7B, 14B, and 32B models
- 通义千问 Math:数学语言模型
- Qwen2-Math: 1.5B、 7B 及 72B 模型
- Qwen2.5-Math: 1.5B、 7B 及 72B 模型
- Qwen-Math-RM: the reward models for mathematics
- Qwen2-Math-RM: 72B models
- Qwen2.5-Math-RM: 72B models
- Qwen2.5-Math-PRM: 7B and 72B models
2025-03-06(四)