当前位置：首页 > news >正文

PPIO上线DeepSeek-V3.2-Exp：引入稀疏注意力机制，API 大幅降价

news 2025/9/30 11:18:06

今天，DeepSeek 突然发布新版本模型 DeepSeek-V3.2-Exp，PPIO 已经首发上线！

DeepSeek-V3.2-Exp 是 DeepSeek 新模型的实验版本，V3.2-Exp 在 V3.1-Terminus 的基础上引入了 “DeepSeek 稀疏注意力机制（DeepSeek Sparse Attention）”，旨在探索和验证在长上下文场景下训练和推理效率的优化。

该实验版本代表了 DeepSeek 对更高效的 Transformer 架构的持续研究，特别注重提高处理扩展文本序列时的计算效率。

DeepSeek 稀疏注意力首次实现了细粒度稀疏注意力，在保持几乎相同的模型输出质量的同时，显著提高了长上下文训练和推理效率。DeepSeek-V3.2-Exp 支持 160K 上下文。
为了严格评估引入稀疏注意力机制的影响，DeepSeek 特意将 DeepSeek-V3.2-Exp 的训练配置与 V3.1-Terminus 进行了对齐。在各个领域的公开基准测试中，DeepSeek-V3.2-Exp 的表现与 V3.1-Terminus 相当。
基于新架构，DeepSeek-V3.2-Exp 也能在训练推理提效的同时实现 API 价格的大幅下降。PPIO 平台的定价为：每百万输入 tokens 2元，每百万输出 tokens 3元。

现在，你可以到 PPIO 官网（或点击文末阅读原文）在线体验 DeepSeek-V3.2-Exp ，或将模型 API 接入 Cherry Studio、ChatBox 或者你自己的 AI 工作流中。新用户填写邀请码【24CGOJ】注册可得 15 元代金券。

在线体验入口：

https://ppio.com/llm/deepseek-deepseek-v3.2-exp

开发者文档：

https://ppio.com/docs/model/overview

DeepSeek-V3.2 技术报告也已经发布，标题为《 DeepSeek-V3.2-Exp: Boosting Long-Context Efficiency with DeepSeek Sparse Attention》。感兴趣的开发者、用户可扫下方二维码下载，并加入开发者社群。

http://www.dtcms.com/a/423894.html

相关文章：

成都私人视频网站制作平台沈阳看男科的权威医院

从零开始掌握 uv：新一代超快 Python 项目与包管理器（含 Windows 支持）

天津网站建设泰姆仕四川网络营销推广

政务网站建设经验做法东莞企业网站建设预算大概多少

怎么做网站icp备案有没有学做家具的网站

新天力科技冲刺北交所：供应链韧性成资本市场“加分项”

Linux之线程池

摄影师网站html5wordpress分类加密

免费机械网站模板绵阳市建设工程监督网站

React Native 中的 useCallback

哪些网站做的比较好看480元做网站

DSC蓝宝石法：精准测量材料比热容的核心技术

在 Kubernetes 集群中运行并发布应用程序

Node.js面试题及详细答案120题（81-92） -- 框架与生态篇

永久网站域名注册网页版传奇大全

软考~系统规划与管理师考试—知识篇—第二版—1.2 信息技术及其发展

常德网站开发服务抚顺网络推广

建设网站的个人心得青冈网站建设

LeetCode 分类刷题：33. 搜索旋转排序数组

Pi Network创始人Dr. Chengdiao Fan将在TOKEN2049发表演讲，探讨加密货币现实应用

网站建设工具哪家好邵阳网站建设制作

【WSL2】win11访问ubuntu

网站建设专家排名信誉好的龙岗网站设计

SpringWebFlux：响应式Web框架

网站建设中的图片及视频要求青岛的互联网企业

CS231n 2025——作业参考与学习笔记导航页

【Android之路】 Kotlin 的 data class、enum class、sealed interface

公司网站注册要多少钱网页设计作业介绍家乡

[特殊字符]函数指针：C语言的动态灵魂，嵌入式的超能力（202589)

海口网站建设高端asp.net做电商网站