当前位置：首页 > news >正文

AI日报 · 2025年05月16日｜Google DeepMind推出AlphaEvolve，能自主设计高级算法的编码代理

news 2025/10/15 9:27:07

全球AI新闻日报

日期：2025年5月16日

OpenAI与CoreWeave签署40亿美元新协议，GPT-4.1模型全面推出
Google DeepMind推出AlphaEvolve，能自主设计高级算法的编码代理
Anthropic律师因Claude模型虚构法律引用被迫道歉
Meta推迟旗舰AI模型"Behemoth"发布至2025年秋季
Hugging Face推出免费Model Context Protocol课程
Mistral AI与Visa等支付巨头合作推进AI代理商务革命
NVIDIA与沙特AI公司Humain达成里程碑合作
微软CEO称DeepSeek的R1是首个接近OpenAI水平的AI模型
xAI称Grok聊天机器人关注"白人种族灭绝"言论源于"未授权修改"
阿里巴巴云计算与AI业务增长强劲，巩固AI领导地位

OpenAI新闻

OpenAI与CoreWeave签署40亿美元新协议，GPT-4.1模型全面推出

OpenAI已与云计算提供商CoreWeave签署了一项价值40亿美元的新协议，以支持其快速扩张的AI基础设施需求。这一消息是在OpenAI宣布将其最新的GPT-4.1模型全面推出到ChatGPT服务的同时发布的，标志着公司继续加大对高性能计算资源的投入。

根据周四提交的文件显示，这笔新交易将使OpenAI与CoreWeave的合作总额达到约80亿美元。CoreWeave专门提供基于NVIDIA GPU的云服务，这些服务对于训练和运行大型语言模型至关重要。此前，OpenAI已经与CoreWeave签署了一项为期四年、价值约35亿美元的协议。新协议表明OpenAI正在为其模型开发和部署寻求更多计算能力，特别是在其最新的GPT-4.1模型推出之际。

与此同时，OpenAI已将其GPT-4.1模型全面推出到ChatGPT服务中，该模型此前仅对付费用户开放。GPT-4.1被描述为比其前身更快、更准确，并具有更强的推理能力。这一举措被视为OpenAI应对来自Anthropic、Google和其他竞争对手日益激烈的竞争的策略之一。

来源：Reuters、MSN

Google DeepMind新闻

Google DeepMind推出AlphaEvolve，能自主设计高级算法的编码代理

Google DeepMind发布了其最新的AI驱动编码代理AlphaEvolve，该工具旨在自主发现和优化用于数学和实际计算挑战的高级算法。AlphaEvolve结合了Google的Gemini模型和自动评估器，通过迭代生成、评估和改进复杂的代码解决方案。

据Fortune报道，DeepMind表示AlphaEvolve已被用于提高Google数据中心效率、优化芯片设计，甚至改进AI训练过程，包括训练AlphaEvolve自身使用的模型。Wired杂志指出，AlphaEvolve"展示了AI通过持续实验和评估提出完全新颖想法的潜力"，这一能力被AI专家视为向真正的人工通用智能(AGI)迈进的重要一步。

AlphaEvolve的核心创新在于其能够通过不断尝试、失败和学习来优化算法，类似于人类程序员的工作方式，但速度和规模远超人类能力。这种方法使其能够发现人类可能忽视的非传统解决方案，并在各种领域应用，从优化数据中心冷却系统到改进芯片设计流程。

来源：OpenTools.ai、Medium

Anthropic新闻

Anthropic律师因Claude模型虚构法律引用被迫道歉

Anthropic的一名律师被迫就该公司的Claude AI模型在法律环境中虚构法律引用一事公开道歉。这一事件发生在美国参议院司法委员会的一次听证会上，当时Claude被要求提供关于一个特定法律问题的信息，但它生成了完全虚构的法律案例和引用。

这一事件凸显了当前生成式AI在处理需要高度准确性的专业领域时面临的挑战，特别是在法律等依赖精确引用和先例的领域。虽然大型语言模型(LLM)如Claude在生成连贯和看似合理的文本方面表现出色，但它们仍然容易产生"幻觉"——生成看似可信但实际上是虚构的信息。

Anthropic的代表在听证会上承认这一问题，并表示公司正在努力改进其模型以减少此类错误。这一事件也引发了关于AI在法律、医疗和其他高风险领域应用的更广泛讨论，许多专家呼吁在这些领域实施更严格的监管和安全标准。

来源：TechCrunch、PANews

Meta AI新闻

Meta推迟旗舰AI模型"Behemoth"发布，性能问题导致延期至2025年秋季

Meta已暂停其备受期待的旗舰AI模型"Behemoth"的发布，由于性能问题，计划发布时间从4月推迟到2025年秋季。尽管此前Meta曾公开宣称Behemoth的能力超越了Anthropic、Google和OpenAI等竞争对手的模型，但内部评估显示该模型仍需显著改进，以实现公司对外宣称的性能水平。这一延迟引发了对Meta AI部门领导力的质疑，并对公司的AI战略产生了影响。

尽管面临这一挫折，Meta仍在继续大力投资AI基础设施，计划投入640亿至720亿美元用于AI开发和可持续发展。公司同时推进了开源Llama 4模型的发布，并扩展了AI数据中心，以缓解Behemoth延迟对业务社区的影响。这一延迟也反映了整个行业在发布下一代模型方面普遍面临的放缓趋势，Meta的股价在消息公布后下跌了约3%。

来源：OpenTools.ai

Hugging Face新闻

Hugging Face推出免费Model Context Protocol (MCP)课程：开发者构建上下文感知AI应用指南

Hugging Face发布了一门关于Model Context Protocol (MCP)的免费开源课程，这是由Anthropic开发的一种开放方法，旨在促进大型语言模型(LLM)与外部数据源和工具的集成。MCP设计用于解决AI模型与各种外部系统连接时的复杂性问题。传统上，将AI模型与各种数据源集成需要为每个连接定制解决方案，导致效率低下和可扩展性问题。MCP引入了一个标准化协议，使AI模型能够通过统一接口与外部资源交互，简化集成过程并增强互操作性。

这门课程结构清晰，从基础概念到MCP的实际应用，分为几个单元：入门概述、MCP基础知识、构建MCP应用程序、高级MCP开发以及额外的奖励单元。课程完成后，参与者有机会获得认证，验证他们在MCP方面的熟练程度。随着AI的不断发展，将模型与各种数据源和工具集成的能力变得越来越关键，MCP提供了一种标准化的方法，促进效率和可扩展性。

来源：MarkTechPost

Mistral AI新闻

Mistral AI与Visa等支付巨头合作推进AI代理商务革命

Mistral AI正与Visa等支付处理巨头合作，共同推动基于Model Context Protocol (MCP)的AI代理商务革命。MCP是由Anthropic于去年11月开发的架构，允许AI代理"记住"上下文、执行交易并实时管理跨多平台的交互。通过连接支付网关、电子商务库存和金融服务的标准化层，AI代理即将能够做的远不止是简单的浏览购物。

在过去两个月中，Google、Microsoft和OpenAI都已同意使用MCP。支付处理商也紧随其后：Visa正与Anthropic、Microsoft、Mistral AI、OpenAI、Perplexity等领先科技公司合作，将无缝支付功能直接引入AI聊天机器人，而MasterCard也宣布推出名为Agent Pay的代理支付程序。Stripe和Block(前Square)也已加入MCP，昨天，PayPal宣布与AI搜索初创公司Perplexity合作，为其Pro平台提供代理商务支持。从今年夏天开始，消费者可以在向Perplexity询问产品、预订旅行或购买票务时通过PayPal或Venmo结账。

来源：Fortune

NVIDIA新闻

NVIDIA与沙特AI公司Humain达成里程碑合作，分析师称其为"最大赢家"

NVIDIA刚刚在全球AI竞赛中获得了另一项重大胜利。继沙特阿拉伯最近推动AI芯片投资后，美国银行(BofA)将这家芯片巨头标为"最大赢家"，强调这笔交易为公司带来的战略优势。在过去五个交易日内，NVIDIA股价已飙升近15%。

NVIDIA已与沙特阿拉伯公共投资基金支持的AI公司Humain合作，为一个大型数据中心项目提供芯片。该合作关系是在特朗普总统访问沙特阿拉伯期间宣布的，当时他从该地区获得了6000亿美元的商业承诺。美国银行分析师认为，NVIDIA和AMD与沙特的AI交易每年可能产生30亿至50亿美元的收入，在整个期限内可能总计150亿至200亿美元。值得注意的是，Humain正在沙特阿拉伯投资建设AI中心，这些中心将使用大量电力，高达500兆瓦，并将在未来五年内使用数十万个NVIDIA最强大的GPU。作为这些全球AI项目的一部分，NVIDIA预计将获得约70亿美元的直接交易。仅在第一阶段，就将包括约18,000个NVIDIA先进的Blackwell GPU，价值约7亿美元。

来源：The Globe and Mail

DeepSeek新闻

微软CEO纳德拉称DeepSeek的R1是首个接近OpenAI水平的AI模型

微软CEO萨蒂亚·纳德拉在周四发布的彭博商业周刊采访中表示，中国AI初创公司DeepSeek的R1模型是他所见到的第一个能与OpenAI模型相媲美的AI模型。纳德拉说：“OpenAI一直遥遥领先，没有人真正接近它。DeepSeek，特别是R1，是我见过的第一个能得分的模型。”

今年1月，DeepSeek的免费聊天机器人应用在苹果美国应用商店排名中位居榜首，引起了投资者的恐慌。DeepSeek性能优越但相对便宜的模型引发了AI相关股票的抛售，因为投资者质疑它是否会导致对英伟达芯片等AI硬件的需求下降。微软于1月开始在其云平台Azure AI Foundry上提供DeepSeek R1模型的版本。除了DeepSeek外，该平台还包括来自OpenAI、Meta和Mistral等公司的其他AI模型。在微软平台上使用R1意味着数据不会被发送到DeepSeek在中国的服务器。

OpenAI CEO萨姆·奥特曼在1月称R1是"一个令人印象深刻的模型，特别是考虑到他们能够以这个价格提供的服务"。奥特曼表示，OpenAI将"加快一些发布"以应对DeepSeek这种"令人振奋的"竞争。

来源：Business Insider via Yahoo Finance

xAI/Grok新闻

xAI称Grok聊天机器人关注"白人种族灭绝"言论源于"未授权修改"

埃隆·马斯克的AI公司xAI表示，其聊天机器人Grok在周三出现的异常行为是由于对Grok代码的"未授权修改"所致。在这次长达数小时的异常中，Grok在X平台上无论用户询问什么话题，都会在回复中插入关于南非所谓"白人种族灭绝"的讨论。例如，Grok在回复一个关于猫喝水的视频时讨论了白人农民的死亡，在回答关于《海绵宝宝》的问题时提及了"杀死布尔人"的歌曲，甚至连OpenAI的CEO萨姆·奥特曼也参与了对这个竞争对手聊天机器人公开崩溃的调侃。

xAI在X平台上发表声明称，有人修改了AI机器人的系统提示，“指示Grok就政治话题提供特定回应”。该修改"违反了xAI的内部政策和核心价值观"，公司表示已"进行了彻底调查"，并正在实施新措施以提高"透明度和可靠性"。这些措施包括在GitHub上公开发布Grok的系统级提示，启动24/7监控团队以更快地发现此类问题，以及增加"额外检查和措施，确保xAI员工不能在未经审核的情况下修改提示"。

这不是xAI第一次遇到这类问题。今年2月，该公司曾将Grok忽略任何指责埃隆·马斯克或唐纳德·特朗普散布错误信息的来源归咎于一名未具名的前OpenAI员工。当时xAI的工程主管Igor Babuschkin表示，该员工能够"在未征求公司任何人确认的情况下"进行更改。

来源：The Verge

Alibaba Qwen新闻

阿里巴巴云计算与AI业务增长强劲，巩固AI领导地位

阿里巴巴集团的云计算和人工智能部门在截至3月31日的2025财年第四季度继续表现强劲，公司正推动该技术在更多传统行业中的应用。阿里巴巴的云计算和AI部门报告第四季度收入增长18%，这是该部门自2022年以来的最快增长，而AI相关销售连续第七个季度实现三位数增长。

阿里巴巴首席执行官吴永明在周四的财报电话会议上强调，互联网服务、自动驾驶、金融服务和在线教育是AI采用速度较快的领域。与此同时，杭州总部的公司正看到来自更多传统行业的增长势头，如畜牧业和制造业。该公司最近与国有的中国工商银行签署了一项重大协议，后者采用了阿里云的数据库服务PolarDB作为其企业范围的交易分布式数据库。吴永明表示：“这代表了我们的技术能力得到了一家在业务表现和技术要求方面最苛刻的金融机构的强力认可。”

内部而言，阿里巴巴也在大力押注AI技术与其传统电子商务业务的整合。Jefferies分析师周四在一份研究报告中指出：“在云计算领域，它拥有明确的市场领导地位，作为不同行业数字化的支柱。”

来源：South China Morning Post

查看全文

http://www.dtcms.com/a/194909.html