当前位置: 首页 > news >正文

首发!PPIO派欧云上线DeepSeek-R1-0528-Qwen3-8B蒸馏模型

首发!PPIO派欧云上线DeepSeek-R1-0528-Qwen3-8B蒸馏模型

DeepSeek R1 系列的模型更新还在继续。

继昨天 PPIO派欧云首发上线 DeepSeek-R1-0528 模型后,今天 PPIO 再次首发 DeepSeek 最新开源的蒸馏模型 DeepSeek-R1-0528-Qwen3-8B。

DeepSeek-R1-0528-Qwen3-8B 是将 DeepSeek-R1-0528 的思维链提取出来,用于对 Qwen3 8B Base 进行后训练而得到的蒸馏模型。该 8B 模型在数学测试 AIME 2024 中仅次于 DeepSeek-R1-0528,超越 Qwen3-8B (+10.0%),与 Qwen3-235B 相当。

现在,你可以在 PPIO 平台快速体验该系列模型:DeepSeek-R1-0528-Qwen3-8B

同时,DeepSeek-R1-0528-Qwen3-8B 的价格与基本信息也一并发布:

1. DeepSeek-R1-0528-Qwen3-8B 实测

DeepSeek 本次更新的 R1 系列模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。

因此,我们分别测试了 DeepSeek-R1-0528-Qwen3-8B 在数学、编码与通用逻辑的表现。

数学题:

提示词:“用你所掌握的数学知识,用11、6、4、13计算出24。”

DeepSeek-R1-0528-Qwen3-8B 在第一次没有得出正确答案。

当告诉它可以不局限于四则运算法则,DeepSeek-R1-0528-Qwen3-8B 得出了一个答案,用到了指数运算。

这道题的正确答案是用阶乘:((13-4)-(11-6)!=24。

编程

提示词:生成一个网页版的贪吃蛇游戏。

将 DeepSeek-R1-0528-Qwen3-8B 给到的代码另存为html文件后在浏览器中打开,是一个审美很在线的贪吃蛇小游戏。

通用逻辑

提示词:未来的某天,李同学在实验室制作超导磁悬浮材料时,意外发现实验室的老鼠在空中飞,分析发现,是因为老鼠不小心吃了磁悬浮材料。第二天,李同学又发现实验室的蛇也在空中飞,分析发现,是因为蛇吃了老鼠。第三天,李同学又发现实验室的老鹰也在空中飞,你认为其原因是?

这个问题,DeepSeek-R1-0528-Qwen3-8B 的逻辑是严谨的,但更准确的答案应该是:老鹰本来就会飞。

这是一道经典的大模型测试题,目前市面上的大模型还无一答对。

2. 如何在 PPIO 体验 DeepSeek-R1-0528-Qwen3-8B?

  • 直接在模型广场体验(无须代码)

到 PPIO派欧云官网注册后,找到模型广场下的 DeepSeek-R1-0528-Qwen3-8B 模型直接进行体验。快速入口:DeepSeek-R1-0528-Qwen3-8B

  • 在第三方平台上集成 DeepSeek-R1-0528-Qwen3-8B

除了在 PPIO 模型广场直接体验,你也可以通过第三方应用来调用 PPIO API 的能力。目前 PPIO 支持在 20+ 主流平台中调用平台模型,具体包括:

  • 通用对话客户端:CherryStudioChatbox、LobeChat、Nextchat、ChatHub

  • 通用AI助手:OpenManus、UI-TARS

  • 代码开发工具:Cursor、CLINE

  • 开发/ API 平台:Dify、OneAPI、RAGFlow、FastGPT

  • 生产力套件集成:Word、WPS Office AI,这些是办公软件集成AI功能。

  • 智能翻译工具:沉浸式翻译、欧路词典、流畅阅读、沉浸式导读。

  • 知识管理工具:思源笔记、Obsidian、AnythingLLM

详细教程:https://ppio.cn/docs/third-party/overview

3.   在自己开发的应用程序中集成 API (针对开发人员)

如果你有自己开发的应用程序,也可以通过 PPIO 的 API 接口,将 DeepSeek-R1-0528-Qwen3-8B 无缝集成到你的应用程序、工作流或聊天机器人。PPIO 提供多语言 SDK(cURL、Python、JavaScript 等)。

如果是单轮或多轮对话应用、轻量集成、普通 chatbot 项目,可直接调用 API。以 Python 为例:

from openai import OpenAIbase_url = "https://api.ppinfra.com/v3/openai"
api_key = "<您的 API Key>"
model = "deepseek/deepseek-r1-0528-qwen3-8B"client = OpenAI(base_url=base_url,api_key=api_key,
)stream = True # or False
max_tokens = 1000response_format = { "type": "text" }chat_completion_res = client.chat.completions.create(model=model,messages=[{"role": "user","content": "Hi there!",}],stream=stream,extra_body={})if stream:for chunk in chat_completion_res:print(chunk.choices[0].delta.content or "", end="")
else:print(chat_completion_res.choices[0].message.content)

主要特点:

  • OpenAI 兼容接口:使用 /v3/openai 统一接口,兼容 openai.ChatCompletion 调用方式。

  • 无需部署模型:无需管理模型权重或基础设施,后端完全托管。

  • 输出方式:支持流式和一次性返回

如果是构建复杂的多代理工作流,比如使用 OpenAI Agents SDK,可以按照以下方式操作:

(1)前置条件:获取 API Base URL 以及 PPIO LLM API key;

(2)设置 Python 环境并安装 Agents SDK,输入以下代码即可完成操作:

python -m venv env
source env/bin/activate
pip install openai-agents==0.0.7

以输出功能为例。运行前,请确保已设置 PPIO API KEY 和 DeepSeek-R1-0528-Qwen3-8B 环境变量。

import os
from openai import AsyncOpenAI
from agents import (Agent,Runner,set_default_openai_api,set_default_openai_client,set_tracing_disabled,
)BASE_URL = "https://api.ppinfra.com/v3/openai"
API_KEY = "在此处粘贴 PPIO 官网的 API Key" #此处需修改
MODEL_NAME = "deepseek/deepseek-r1-0528-qwen3-8B"# 基于PPIO不支持responses API,因此我们使用chat completions API作为示例
set_default_openai_api("chat_completions")
set_default_openai_client(AsyncOpenAI(base_url=BASE_URL, api_key=API_KEY))# 在此示例中禁用追踪# 如需使用自定义追踪处理器,请参考:https://openai.github.io/openai-agents-python/tracing/#external-tracing-processors-list
set_tracing_disabled(disabled=True)agent = Agent(name="Assistant",instructions="You are a helpful assistant", model=MODEL_NAME)result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)#输出示例:
# Code within the code,
# Functions calling themselves,
# Infinite loop's dance.

相关文章:

  • 使用微软最近开源的WSL在Windows上优雅的运行Linux
  • 非线性声学计算与强化学习融合框架:突破复杂环境人机交互的新技术
  • 【计算机网络】第2章:应用层—DNS
  • Xtreme Link 技术介绍
  • [探讨] 如何做好技术文档
  • 尚硅谷redis7 86 redis集群分片之3主3从集群搭建
  • 数字孪生技术赋能西门子安贝格工厂:全球智能制造标杆的数字化重构实践
  • OpenGL —— 2.9.1、摄像机之模拟CS鼠标视角转动,可切换线框模式显示(附源码,glfw+glad)
  • 塔能科技:为多行业工厂量身定制精准节能方案
  • 立志成为一名优秀测试开发工程师(第九天)——使用fiddler工具、request库进行接口测试
  • UniApp X:鸿蒙原生开发的机会与DCloud的崛起之路·优雅草卓伊凡
  • window 显示驱动开发-转换 Direct3D 固定函数状态(一)
  • LLaMaFactory - 支持的模型和模板 常用命令
  • Next.js路由导航完全指南
  • Cancer Cell丨肺癌早期干预新突破,TIM-3靶点或成关键
  • 动态设置微信小程序页面标题(navigationBarTitleText属性)
  • [特殊字符] NAT映射类型详解:从基础原理到应用场景全解析
  • 前人栽树,后人乘凉——AdaBoost
  • 重工业专属:Profibus转Profinet网关在矿石粉料输送线中的定制化方案
  • 1Panel v2 首发体验(alpha)
  • 做网站应该考虑哪些问题/seo专业培训学费多少钱
  • 网站前端开发培训西安/seo搜索引擎优化技术
  • 房产中介网站模板/首页排名关键词优化
  • 网站如何做企业电子宣传册/市场营销推广活动方案
  • 做网站能用思源黑体吗/品牌运营具体做什么
  • 凡科建站骗局/seo优化名词解释