当前位置：首页 > news >正文

【AI News | 20250429】每日AI进展

news 2025/10/31 2:05:50

AI Repos

1、aci
ACI.dev是一个开源基础设施层，旨在为AI智能体的工具使用提供支持。它通过统一的模型-上下文-协议（MCP）服务器或轻量级Python SDK，使智能体能够以感知意图的方式访问600多种工具，并具备多租户认证、细粒度权限和动态工具发现等功能。ACI.dev解决了构建生产级AI智能体时面临的基础设施难题，如大规模认证、工具发现和自然语言权限管理，支持各种LLM框架和智能体架构，并提供丰富的预构建集成，助力开发者快速构建功能强大的AI应用。
在这里插入图片描述

2、crawl4ai
Crawl4AI是一个流行的开源GitHub项目，专为LLMs、AI智能体和数据管道设计，提供高速、AI友好的Web爬取和数据抓取功能。它能生成优化的Markdown格式，速度比传统方法快6倍，并提供灵活的浏览器控制、启发式智能提取，无需API密钥即可部署。最新版本v0.6.0引入了世界感知爬取、表格数据提取、浏览器池化、网络流量捕获和MCP集成等新特性，并改进了Docker部署。Crawl4AI旨在通过开源工具 democratize 数据提取，赋能AI应用。

AI News

1、通义千问Qwen3发布：首创混合推理模式，性能全面提升并开源
通义千问团队发布新一代开源大语言模型Qwen3，包含稠密和混合专家（MoE）共八款不同规模模型，性能在代码、数学和通用能力基准测试中均表现出色，部分小模型性能甚至匹敌前代大模型。Qwen3首创“思考模式”与“非思考模式”混合推理，兼顾复杂推理和快速响应，并支持119种语言及方言。模型原生支持MCP协议，具备智能体能力和多模态扩展潜力。Qwen3以Apache2.0协议开源，提供高性能、低成本的AI解决方案，并已在Hugging Face、ModelScope等平台开放使用。

2、ChatGPT搜索新增网购功能：对话式个性化商品推荐
OpenAI在ChatGPT Search中新增网购功能，用户可通过自然对话获取时尚、美妆、家居和电子产品等个性化商品推荐，并直接查看图片、评价及购买链接，实现一站式购物。ChatGPT能记忆用户偏好，提供精准匹配，且商品推荐基于第三方数据，保证中立性。目前该功能处于测试阶段，未来将扩展更多商品类别，并同步推出引文改进和趋势话题追踪等搜索增强功能，有望革新线上购物体验。

3、新创公司Cheehoo推出AI动画工具，赋能艺术家与创作者
由梦工厂前总裁、苹果前科学家及Rideback联合创始人等行业资深人士创立的新兴公司Cheehoo正式上线beta版，致力于利用AI技术革新动画制作。Cheehoo旨在将AI的力量赋予艺术家和版权持有者，解决行业痛点，提供快速创建和迭代角色动画、保持艺术风格一致性及精确控制的能力，并兼容专业动画和游戏流程，同时保障数据和知识产权安全。公司的目标是赋能艺术家，借助AI工具简化动画制作流程，创造新一代动画品牌。

4、豆包视频生成功能升级：提升语义理解与多种风格
豆包宣布其视频生成功能迎来重大升级，显著提升了语义理解能力，使得生成的视频内容更贴合用户意图。同时，视频的影调和画质也得到优化，人物动作更加连贯。此次升级还带来了更多样化的视频风格，包括彩铅、积木、黑白素描、像素和3D动画等。该功能由豆包的Seedance模型支持，用户可通过豆包App和网页端免费体验通过文字或图片生成高质量视频。

5、蚂蚁数科发布金融智能体开发平台Agentar，内测上线超百个金融MCP服务
蚂蚁数科正式发布金融智能体开发平台Agentar，为金融机构提供一站式、全栈的智能体开发工具，旨在高效打造自主决策、可信可靠的金融智能体应用。Agentar依托蚂蚁集团在金融级场景中积累的AI技术能力，提供算力调度、数据治理、模型训推及应用落地等服务，并结合高质量金融知识库和低代码可视化编排能力，降低智能体搭建门槛。平台内测上线了国内首个金融MCP服务广场，包含超百个核心金融MCP服务及行业know-how组件库，并具备金融级安全合规保障。蚂蚁数科致力于通过Agentar推动金融服务迈向智慧化时代。

6、暗月之面开源Kimi-VL模型：2.8亿参数处理文本、图像和视频，媲美大型模型
中国初创公司Moonshot AI发布开源多模态模型Kimi-VL，仅用2.8亿活跃参数即展现出处理图像、文本和视频的卓越能力，并在多项基准测试中媲美大型模型。Kimi-VL擅长处理长文档、复杂推理和用户界面，其128K tokens的上下文窗口使其能处理整本书籍或长视频记录。该模型采用混合专家架构，仅激活部分参数，实现了高效性能。Moonshot AI强调其训练方法结合了监督微调和强化学习，未来计划开发更大规模版本以应用于科研和工业领域。Kimi-VL的演示版本已在Hugging Face上线。

7、Gen-4References惊艳发布：AI实时混合图像，精准控制光影氛围
Gen-4References是一种新兴的AI图像生成技术，能够实时融合两张参考图像，并根据用户描述的构图需求生成新图像，精准保留环境光影并支持复杂主体定位。该技术基于先进的生成模型和图像处理技术，实现了动态图像混合和光影一致性，并支持高分辨率输出和用户友好的文本驱动交互。其在数字艺术、影视游戏、电商广告等领域展现出广泛的应用潜力，有望超越传统图像编辑工具，为AI创作带来新的突破。目前该技术尚处于测试阶段，具体平台和定价待公布。

查看全文

http://www.dtcms.com/a/163526.html