当前位置：首页 > news >正文

【AI News | 20250327】每日AI进展

news 2025/9/22 17:12:33

AI Repos

1、playwright-mcp
使用Playwright提供浏览器自动化功能的MCP服务，核心是让LLM通过结构化的可访问性快照与网页交互，不需要依赖截图或视觉模型。可以用来自动填写网页表单、自动收集网页信息、自动进行网页测试等。支持两种模式：快照模式（默认）：使用可访问性快照；视觉模式：使用截图进行视觉交互。
在这里插入图片描述

AI News

1、SplxAI 获 700 万美元融资，强化企业 AI 安全部署
SplxAI 公司宣布获得 700 万美元种子融资，由 LAUNCHub Ventures 领投，多家机构参投。资金将用于加速其平台开发，帮助企业确保 AI 代理及应用的安全性。SplxAI 专注 Agentic AI 安全，提供自动化测试与动态修复，应对大型语言模型中的复杂威胁。平台模拟攻击场景，识别漏洞，支持文本、图像、语音等多模态安全保障。自 2024 年 8 月推出以来，公司季度增长达 127%，客户包括 KPMG、Glean 等。SplxAI 的自动化方案比传统测试更高效，成本仅为五分之一。

2、Anthropic 即将推出 Claude 3.7，支持 50 万上下文窗口并增强编码与搜索功能
Anthropic 公司计划发布 Claude 3.7 Sonnet，支持 500,000 个上下文窗口，相较当前 200,000 个大幅提升，满足用户对更大输入容量的需求，尤其在编码场景中备受期待。此前发布的 Claude 3.7 Sonnet 在 SWE-bench 测评中准确率达 62.3%，超越 OpenAI 的 o3-mini，被评为最佳非推理编码模型。新推出的 Claude Code 工具可在终端修复 bug、处理代码问题。此外，Claude 新增网页搜索功能，已在美国付费用户中预览，免费用户及更多地区用户也将很快体验。

3、腾讯开源 HaploVL：AI“看图说话”更精准，强化细粒度视觉理解
腾讯开源团队推出多模态技术 HaploVL，采用单一 Transformer 架构，通过动态融合文本和视觉信息，提升 AI 在视觉-语言交互中的表现，特别在细粒度视觉理解任务上表现出色。HaploVL 摒弃传统“视觉编码器+大语言模型”组合，设计预解码器和后解码器，高效捕捉图像细节并生成连贯回复。采用两阶段训练法，减少数据需求，性能媲美组合式模型。实验显示，其在边缘物体感知等任务中表现优异，适用于自动驾驶等领域。代码和论文已公开。

4、清华微软联手推出 BizGen：一键生成专业信息图与幻灯片
清华大学与微软研究院合作推出 BizGen，一款针对商业内容的 AI 工具，能将长文转化为专业级信息图和幻灯片，解决传统工具文字不清、布局混乱的问题。BizGen 依托 Infographics-650K 数据集和“布局引导的交叉注意力机制”，精准控制视觉元素与文本区域，生成高质量设计。实验表明，其在文字准确性和排版上超越 FLUX、DALL·E3 等模型，支持十种语言和多风格设计。BizGen 降低创作门槛，未来潜力巨大，项目与论文已公开。

5、Databricks TAO 微调 Llama 开源模型，性能逼近 GPT-4o
Databricks 推出 TAO（Test-time Adaptive Optimization）技术，通过无标注数据和强化学习微调 Llama3.370B 模型，性能超越传统方法，甚至逼近 GPT-4o。TAO 采用“测试时计算”理念，自动优化任务多样性，降低企业成本。在 FinanceBench 测试中得分 85.1，超传统微调（81.1）和 o3-mini（82.2）；BIRD-SQL 得分 56.1，接近 GPT-4o（58.1）。目前已在 Llama 上私测，TAO 为开源模型发展注入新活力，展现商业化潜力。

6、美图 WHEE 携手 DeepSeek R1，提示词自动补全助力创意生成
美图旗下 AI 素材生成器 WHEE 接入 DeepSeek R1，通过提示词优化功能，将简单输入转化为专业文案，自动补全光影、构图等关键词，显著降低非专业用户的使用门槛。DeepSeek R1 的语义理解与联想能力，不仅提升输出质量，还激发创作灵感，兼具“翻译器”与“灵感孵化器”作用。此技术已应用于美图多款产品，填补创意与专业指令间的鸿沟，助力用户轻松生成高质量图像内容。

7、OpenAI 支持 Anthropic MCP 标准，Agent SDK 已集成提升 AI 响应质量
OpenAI 宣布支持 Anthropic 的模型上下文协议（MCP），将其融入 ChatGPT 桌面应用及 Agents SDK，未来还将扩展至响应 API。MCP 提升 AI 助手响应准确性，允许模型从商业工具、软件等数据源获取信息，实现双向连接。Anthropic 开源 MCP 后，Block、Replit 等公司已加入支持行列。OpenAI 首席执行官阿尔特曼与 Anthropic 首席产品官克里格均对此表示欢迎，MCP 正成为蓬勃发展的开放标准，未来潜力备受期待。

8、阿里巴巴推出 Qwen2.5-Omni 全模态大模型，刷新行业纪录挑战全球巨头
阿里巴巴发布首个全模态大模型 Qwen2.5-Omni-7B，能同时处理文本、图像、音频和视频，并实时生成文本与语音输出。在 OmniBench 评测中，其性能超越 Google Gemini-1.5-Pro，刷新纪录，展现阿里在 AI 领域的领先地位。该模型模拟人类多感官认知，提供智能反馈，适用于教育、医疗等场景。通过开源，阿里吸引全球开发者，推动多模态 AI 应用发展，为行业数字化转型注入新动力。

查看全文

http://www.dtcms.com/a/94160.html