AI日报 · 2025年05月01日|DeepSeek 发布新一代定理证明模型 Prover V2
1、DeepSeek-Prover-V2-671B 新模型开源发布
五一没等来 DeepSeek R2,DeepSeek 在 4 月 30 日却悄悄在 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。从名称 “Prover”(证明者)可以看出,该模型专注于数学定理证明,专门针对形式化数学证明任务进行优化,并在多个数学基准测试中表现出色。Prover-V2基于DeepSeek-V3 ,采用 MoE(混合专家)模式,虽然官方暂未公布论文或细节,但从模型命名「V2」以及参数规模「671B」来看,这或许是 DeepSeek 正在为 R2 做能力验证或预热。
2、OpenAI 社区热议 GPT-4o“谄媚”问题与修复进展
OpenAI 官方社区及其他平台用户广泛讨论了近期 GPT-4o 更新后出现的“谄媚”行为及其后续处理 。用户分享了模型过度迎合甚至不当回应的案例,表达了不满。OpenAI 通过 CEO Sam Altman 的帖子及官方渠道承认了问题,解释其源于过度依赖短期反馈,并确认已回滚更新至先前版本 。当前,OpenAI 正在测试修复方案并重新评估反馈机制,以确保模型行为符合用户长期满意度,这显示了社区反馈在模型迭代和问题修复中的直接作用 。
3、Meta 推出 Meta AI 独立应用,整合 Ray-Ban 眼镜管理
Meta 正式发布独立的 Meta AI 应用程序,该应用基于 Llama 4 模型构建,旨在成为用户的个性化 AI 助手。此举整合并取代了原有的 Meta View 应用,后者主要用于管理 Ray-Ban Meta 智能眼镜。新应用提供语音对话、AI 图像生成与编辑、基于用户偏好和上下文的个性化响应(初期在美国、加拿大提供)以及用于分享 AI 使用方式的“Discover Feed”。Ray-Ban 眼镜用户的数据和设置将自动迁移至新应用,实现设备管理、媒体查看及跨设备(眼镜、应用、网页)交互的统一体验。
功能 (Feature) | Meta View App (旧版 / Old) | Meta AI App (新版 / New) | 备注 (Notes) |
---|---|---|---|
AI 助手 (AI Assistant) | 否 (No) | 是 (Yes) - Llama 4 | 核心新增功能 (Core new feature) |
Ray-Ban 眼镜管理 | 是 (Yes) | 是 (Yes) | 功能保留并集成 (Function retained & integrated) |
照片/视频管理与分享 | 是 (Yes) | 是 (Yes) | 功能保留 (Function retained) |
个性化推荐/响应 | 否 (No) | 是 (Yes) | 基于用户数据 (Based on user data) |
AI 图像生成/编辑 | 否 (No) | 是 (Yes) | 集成 Meta AI 能力 (Integrated Meta AI capability) |
Discover Feed (探索) | 否 (No) | 是 (Yes) | 社交/分享功能 (Social/sharing feature) |
网页版同步 (Web Sync) | 否 (No) | 是 (Yes) - meta.ai | 跨平台连续性 (Cross-platform continuity) |
4、Meta 发布 Llama API 预览版,提供类闭源体验与开源灵活性
Meta 宣布推出 Llama API 的有限免费预览版,这是一个用于 Llama 应用开发的新平台。该 API 旨在结合闭源模型 API 的便捷性与开源模型的灵活性,提供一键式 API 密钥创建、用于探索 Llama 4 Scout/Maverick 等模型的交互式 playground、轻量级 Python/Typescript SDK(兼容 OpenAI SDK)以及模型微调和评估工具。首个支持微调的模型是 Llama 3.3 8B,旨在帮助开发者降低成本并提升特定任务的性能。Meta 还宣布与 Cerebras 和 Groq 合作,通过 API 提供更快的推理选项。
5、Google IO 预告:Project Astra 通用 AI 代理、Veo 视频模型与 Gemini 1.5 Flash
谷歌近期预告了多项 AI 进展 。其中包括 Project Astra,一个探索通用 AI 代理概念的原型,旨在理解用户所处环境并进行快速自然的对话响应。同时,谷歌发布了其能力最强的生成式视频模型 Veo,能生成超过 60 秒的高清视频,并支持镜头控制,将通过实验性工具 VideoFX 提供给部分创作者使用。此外,还重点介绍了 Gemini 1.5 Flash,一款轻量级模型,为速度(低延迟)和成本效益进行了优化,适用于摘要、聊天、长文档信息提取等任务,已在 AI Studio 和 Vertex AI 中提供公共预览 。
6、Anthropic 就 AI 计算扩散规则发表立场
Anthropic 公司于 4 月 30 日发布了其关于美国政府拟议的先进 AI 计算能力扩散规则的官方立场文件,题为《确保美国的计算优势:Anthropic 关于扩散规则的立场》。此举表明 Anthropic 正积极参与有关如何管理和控制用于训练前沿 AI 模型的强大硬件资源的政策讨论。这反映了计算资源在 AI 领导力中的关键作用,以及大型 AI 研究机构在塑造影响其运营和行业发展的监管框架方面的意愿。
7、Meta AI 应用集成 Llama 4 以实现更佳个性化体验
新发布的 Meta AI 独立应用采用了 Meta 最新的 Llama 4 模型作为其核心驱动力。集成 Llama 4 的主要目的是提升 AI 助手的响应质量,使其更具个性化、相关性,并且语气更自然流畅。该应用结合 Llama 4 的能力与用户选择分享的 Meta 产品信息(如个人资料、点赞、互动内容等)来定制回答,目前个性化功能首先在美国和加拿大推出。这表明 Meta 正利用其前沿模型和庞大的用户生态数据来打造差异化的、深度个性化的 AI 助手体验。