当前位置: 首页 > news >正文

超越DeepSeek R1的Moe开源大模型 Qwen2.5-max 和 Qwen Chat Web UI 的发布,阿里搅动AI生态

敲黑板,说重点,最近阿里推出的 Qwen2.5-max 和 Qwen Chat Web UI,将对AI生态又一次冲击。

说冲击,因为 DeepSeek R1的热潮还未散退的情况下,由于服务器压力不能注册新的API,然后价格涨价,服务有时也不稳定,说实话大家对DeepSeek还是颇有微词的,这个时候,阿里推出的 Qwen2.5-max ,在最权威的 测评中 乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B,无疑成为了 DeepSeek V3 和 R1的“最佳平替”!

而另外一个, Qwen Chat Web UI 的推出,将导致 ChatBox , AnythingLLM等众多做应用“壳”的公司面临压力,毕竟,如果大模型厂商直接下场做应用界面了,中介存在的价值似乎没有了。

所以,这一次,AI生态又一次被搅动了!

注意,要体验 Qwen2.5-max ,只能去 Qwen Chat Web UI ,或者去阿里的百炼平台。

工具名称:Qwen 网页版
工具地址:https://chat.qwenlm.ai/

最新的UI如下

以下是之前的页面,不过最近已经更新了,仅供参考!建议登录亲自体验。


 一、工具介绍 ️
Qwen Chat 网页版是阿里通义团队推出的一个集成了多个 Qwen AI 大模型的网站,并且 Qwen Chat 是基于 Open WebUI 构建的。

大家感兴趣也可以看官方的推文:https://x.com/Alibaba_Qwen/status/1877426465349972113

二、核心功能
1.集成多个 QWen 旗舰模型
Qwen Chat 最让人惊喜的是集成了 QWen 大模型家族的大部分旗舰模型,完全免费使用,真是良心。目前模型包括:

  1. Qwen2.5-Plus:支持文本输入,能够处理复杂任务
  2. QVQ-72B-Preview:支持文本、图像输入,用于视觉推理
  3. QwQ-32B-Preview:支持文本输入,擅长思考和推理
  4. Qwen2.5-Coder-32B-Instruct:支持文本输入,擅长写代码
  5. Qwen2-VL-Max:持文本、图像输入,用于视觉理解任务
  6. Qwen2.5-Turbo:支持文本输入,长序列且快速的模型
  7. Qwen2.5-72B-Instruct:支持文本输入,聪明的大语言模型
  8. Qwen2.5-32B-Instruct:支持文本输入,强大的中等规模模型

2.同时选择多个模型对话比较
Qwen Chat 还支持同时选择多个模型进行对话,最多 3 个,用户可以用来比较每个模型生成的效果,使用时,需要在右上角选择多个模型即可:

生成效果如下,可以很直观的对比每个模型的效果:

3.支持预览模式,包括 HTML
Qwen Chat 也支持预览模式,对标 Claude 的 Artifacts 功能,对于生成的 HTML 代码,直接在右侧预览,使用时,需要打开输入框下的“预览模式 ”按钮

Chris 建议大家选择“Qwen2.5-Coder-32B-Instruct”模型,这个模型比较擅长写代码。
4.支持上传图片进行理解
Qwen Chat 支持图像理解,用户上传图片后,Qwen Chat 能够理解图片内容,并作出相应的回答,Chris 建议选择 QVQ-72B-Preview 或 Qwen2-VL-Max 模型:

三、即将推出
QWen Chat 接下来还会推出网页搜索图像生成语音模式等更多功能,Chris 太期待了~
四、收费情况
目前 QWen Chat 完全免费,大家可以使用邮箱登录即可。r/> 五、总结
Qwen Chat 是阿里通义团队推出的全新 Web UI,用于与 Qwen 模型交互。Qwen Chat 支持多种模型、上传文档和图片、支持 HTML 预览等,还有未来将推出的功能。Chris 还是挺期待的。

消息参考:

据通义官微,1月29日,Qwen2.5-Max正式发布。Qwen2.5-Max在知识(测试大学水平知识的MMLU-Pro)、编程(LiveCodeBench)、全面评估综合能力的(LiveBench)以及人类偏好对齐(Arena-Hard)等主流权威基准测试上,展现出全球领先的模型性能。通义团队分别对Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本性能进行了评估测试。指令模型是所有人可直接对话体验到的模型版本,在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等基准测试中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。

2025年1月29日,Qwen2.5-Max正式发布。开发者可在Qwen Chat平台免费体验模型,企业和机构也可通过阿里云百炼平台直接调用新模型API服务。 

2025年2月4日,三方基准测试平台Chatbot Arena公布了最新的大模型盲测榜单,Qwen2.5-Max以1332分位列全球第七名,也是非推理类的中国大模型冠军。同时,Qwen2.5-Max在数学和编程等单项能力上排名第一,在硬提示(Hard prompts)方面排名第二。 

2025年2月6日,在“大模型竞技场”的最新榜单中,阿里巴巴的Qwen2.5-Max排名第7。

相关文章:

  • langchain实现的内部问答系统及本地化替代方案
  • Linux相关概念和易错知识点(27)(认识线程、页表与进程地址空间、线程资源划分)
  • Flask与Jinja2模板引擎:打造动态Web应用
  • 什么是平面环形无影光源
  • Netty源码解析之异步处理(二):盛赞Promise中的集合设计
  • 【云平台监控】Prometheus 监控平台部署与应用
  • 2025年SEO工具有哪些?老品牌SEO工具有哪些
  • uniapp PDF 预览和下载
  • 1.14学习总结
  • BFS 走迷宫
  • 蓝桥杯之并查集
  • 滤波总结 波形处理原理 如何对一个规律的波形进行滤波 显现出真正的波形 如何设计滤波
  • Visionpro 液位高度检测
  • Sentinel 持久化配置
  • LeetCode刷题第6题【Z 字形变换】---解题思路及源码注释
  • 哈希表-四数之和
  • ceph部署-14版本(nautilus)-使用ceph-ansible部署实验记录
  • 常用架构图:业务架构、产品架构、系统架构、数据架构、技术架构、应用架构、功能架构及信息架构
  • java 通过阿里物联网平台推送数据到显示屏
  • 【办公类-90-01】】20250213周计划四类活动的写法(分散运动、户外游戏、个别化(美工室图书吧探索室))