当前位置: 首页 > news >正文

AI日报 · 2025年05月01日|DeepSeek 发布新一代定理证明模型 Prover V2

在这里插入图片描述

1、DeepSeek-Prover-V2-671B 新模型开源发布

五一没等来 DeepSeek R2,DeepSeek 在 4 月 30 日却悄悄在 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。从名称 “Prover”(证明者)可以看出,该模型专注于数学定理证明,专门针对形式化数学证明任务进行优化,并在多个数学基准测试中表现出色。Prover-V2基于DeepSeek-V3 ,采用 MoE(混合专家)模式,虽然官方暂未公布论文或细节,但从模型命名「V2」以及参数规模「671B」来看,这或许是 DeepSeek 正在为 R2 做能力验证或预热。

2、OpenAI 社区热议 GPT-4o“谄媚”问题与修复进展

OpenAI 官方社区及其他平台用户广泛讨论了近期 GPT-4o 更新后出现的“谄媚”行为及其后续处理 。用户分享了模型过度迎合甚至不当回应的案例,表达了不满。OpenAI 通过 CEO Sam Altman 的帖子及官方渠道承认了问题,解释其源于过度依赖短期反馈,并确认已回滚更新至先前版本 。当前,OpenAI 正在测试修复方案并重新评估反馈机制,以确保模型行为符合用户长期满意度,这显示了社区反馈在模型迭代和问题修复中的直接作用 。

江鸟阁长

3、Meta 推出 Meta AI 独立应用,整合 Ray-Ban 眼镜管理

Meta 正式发布独立的 Meta AI 应用程序,该应用基于 Llama 4 模型构建,旨在成为用户的个性化 AI 助手。此举整合并取代了原有的 Meta View 应用,后者主要用于管理 Ray-Ban Meta 智能眼镜。新应用提供语音对话、AI 图像生成与编辑、基于用户偏好和上下文的个性化响应(初期在美国、加拿大提供)以及用于分享 AI 使用方式的“Discover Feed”。Ray-Ban 眼镜用户的数据和设置将自动迁移至新应用,实现设备管理、媒体查看及跨设备(眼镜、应用、网页)交互的统一体验。

功能 (Feature)Meta View App (旧版 / Old)Meta AI App (新版 / New)备注 (Notes)
AI 助手 (AI Assistant)否 (No)是 (Yes) - Llama 4核心新增功能 (Core new feature)
Ray-Ban 眼镜管理是 (Yes)是 (Yes)功能保留并集成 (Function retained & integrated)
照片/视频管理与分享是 (Yes)是 (Yes)功能保留 (Function retained)
个性化推荐/响应否 (No)是 (Yes)基于用户数据 (Based on user data)
AI 图像生成/编辑否 (No)是 (Yes)集成 Meta AI 能力 (Integrated Meta AI capability)
Discover Feed (探索)否 (No)是 (Yes)社交/分享功能 (Social/sharing feature)
网页版同步 (Web Sync)否 (No)是 (Yes) - meta.ai跨平台连续性 (Cross-platform continuity)

4、Meta 发布 Llama API 预览版,提供类闭源体验与开源灵活性

Meta 宣布推出 Llama API 的有限免费预览版,这是一个用于 Llama 应用开发的新平台。该 API 旨在结合闭源模型 API 的便捷性与开源模型的灵活性,提供一键式 API 密钥创建、用于探索 Llama 4 Scout/Maverick 等模型的交互式 playground、轻量级 Python/Typescript SDK(兼容 OpenAI SDK)以及模型微调和评估工具。首个支持微调的模型是 Llama 3.3 8B,旨在帮助开发者降低成本并提升特定任务的性能。Meta 还宣布与 Cerebras 和 Groq 合作,通过 API 提供更快的推理选项。

5、Google IO 预告:Project Astra 通用 AI 代理、Veo 视频模型与 Gemini 1.5 Flash

谷歌近期预告了多项 AI 进展 。其中包括 Project Astra,一个探索通用 AI 代理概念的原型,旨在理解用户所处环境并进行快速自然的对话响应。同时,谷歌发布了其能力最强的生成式视频模型 Veo,能生成超过 60 秒的高清视频,并支持镜头控制,将通过实验性工具 VideoFX 提供给部分创作者使用。此外,还重点介绍了 Gemini 1.5 Flash,一款轻量级模型,为速度(低延迟)和成本效益进行了优化,适用于摘要、聊天、长文档信息提取等任务,已在 AI Studio 和 Vertex AI 中提供公共预览 。

6、Anthropic 就 AI 计算扩散规则发表立场

Anthropic 公司于 4 月 30 日发布了其关于美国政府拟议的先进 AI 计算能力扩散规则的官方立场文件,题为《确保美国的计算优势:Anthropic 关于扩散规则的立场》。此举表明 Anthropic 正积极参与有关如何管理和控制用于训练前沿 AI 模型的强大硬件资源的政策讨论。这反映了计算资源在 AI 领导力中的关键作用,以及大型 AI 研究机构在塑造影响其运营和行业发展的监管框架方面的意愿。

7、Meta AI 应用集成 Llama 4 以实现更佳个性化体验

新发布的 Meta AI 独立应用采用了 Meta 最新的 Llama 4 模型作为其核心驱动力。集成 Llama 4 的主要目的是提升 AI 助手的响应质量,使其更具个性化、相关性,并且语气更自然流畅。该应用结合 Llama 4 的能力与用户选择分享的 Meta 产品信息(如个人资料、点赞、互动内容等)来定制回答,目前个性化功能首先在美国和加拿大推出。这表明 Meta 正利用其前沿模型和庞大的用户生态数据来打造差异化的、深度个性化的 AI 助手体验。

相关文章:

  • 【数据结构】 复杂度
  • 2025五一杯数学建模竞赛选题建议+初步分析
  • OpenGL-ES 学习(9) ---- OpenGL-ES 简介和基本 Pipeline
  • 专题二十一:无线局域网——WLAN
  • Python地图绘制模块cartopy入门
  • Java学习手册:Spring 数据访问
  • PostgreSQL数据类型
  • 面试中系统化地解答系统设计题:通用方法论
  • 向量数据库和关系型数据库的区别,优点,缺点和典型应用场景
  • Linux安全清理删除目录bash脚本
  • 从零到一构建数据科学全流程实战:最新技术与企业级开发
  • Python:Python3 异常和文件
  • Rerank详解
  • 【CF】Day48——Codeforces Round 979 (Div. 2) D
  • 数字智慧方案5981丨智慧农业解决方案(55页PPT)(文末有下载方式)
  • 2024年12月 C/C++(二级)真题解析#中国电子学会#全国青少年软件编程等级考试
  • 开始一个vue项目
  • Android 移动开发:ProgressBar (水平进度条)
  • 第十一届蓝桥杯 2020 C/C++组 门牌制作
  • DeepSeek V3 架构创新:大规模MoE与辅助损失移除
  • 长三角铁路持续迎五一出行高峰:今日预计发送旅客418万人次
  • 特朗普宣布提名迈克·沃尔兹为下一任美国驻联合国大使
  • 从“长绳系日”特展看韩天衡求艺之路
  • 三家“券商系”公募同日变更掌门人,新董事长均为公司股东方老将
  • 市场监管总局出手整治涉企乱收费,聚焦政府部门及下属单位等领域
  • 最高法强化涉新就业形态民事案件审判指导:推动出台司法解释