【AI News | 20250429】每日AI进展
AI Repos
1、aci
ACI.dev是一个开源基础设施层,旨在为AI智能体的工具使用提供支持。它通过统一的模型-上下文-协议(MCP)服务器或轻量级Python SDK,使智能体能够以感知意图的方式访问600多种工具,并具备多租户认证、细粒度权限和动态工具发现等功能。ACI.dev解决了构建生产级AI智能体时面临的基础设施难题,如大规模认证、工具发现和自然语言权限管理,支持各种LLM框架和智能体架构,并提供丰富的预构建集成,助力开发者快速构建功能强大的AI应用。
2、crawl4ai
Crawl4AI是一个流行的开源GitHub项目,专为LLMs、AI智能体和数据管道设计,提供高速、AI友好的Web爬取和数据抓取功能。它能生成优化的Markdown格式,速度比传统方法快6倍,并提供灵活的浏览器控制、启发式智能提取,无需API密钥即可部署。最新版本v0.6.0引入了世界感知爬取、表格数据提取、浏览器池化、网络流量捕获和MCP集成等新特性,并改进了Docker部署。Crawl4AI旨在通过开源工具 democratize 数据提取,赋能AI应用。
AI News
1、通义千问Qwen3发布:首创混合推理模式,性能全面提升并开源
通义千问团队发布新一代开源大语言模型Qwen3,包含稠密和混合专家(MoE)共八款不同规模模型,性能在代码、数学和通用能力基准测试中均表现出色,部分小模型性能甚至匹敌前代大模型。Qwen3首创“思考模式”与“非思考模式”混合推理,兼顾复杂推理和快速响应,并支持119种语言及方言。模型原生支持MCP协议,具备智能体能力和多模态扩展潜力。Qwen3以Apache2.0协议开源,提供高性能、低成本的AI解决方案,并已在Hugging Face、ModelScope等平台开放使用。
2、ChatGPT搜索新增网购功能:对话式个性化商品推荐
OpenAI在ChatGPT Search中新增网购功能,用户可通过自然对话获取时尚、美妆、家居和电子产品等个性化商品推荐,并直接查看图片、评价及购买链接,实现一站式购物。ChatGPT能记忆用户偏好,提供精准匹配,且商品推荐基于第三方数据,保证中立性。目前该功能处于测试阶段,未来将扩展更多商品类别,并同步推出引文改进和趋势话题追踪等搜索增强功能,有望革新线上购物体验。
3、新创公司Cheehoo推出AI动画工具,赋能艺术家与创作者
由梦工厂前总裁、苹果前科学家及Rideback联合创始人等行业资深人士创立的新兴公司Cheehoo正式上线beta版,致力于利用AI技术革新动画制作。Cheehoo旨在将AI的力量赋予艺术家和版权持有者,解决行业痛点,提供快速创建和迭代角色动画、保持艺术风格一致性及精确控制的能力,并兼容专业动画和游戏流程,同时保障数据和知识产权安全。公司的目标是赋能艺术家,借助AI工具简化动画制作流程,创造新一代动画品牌。
4、豆包视频生成功能升级:提升语义理解与多种风格
豆包宣布其视频生成功能迎来重大升级,显著提升了语义理解能力,使得生成的视频内容更贴合用户意图。同时,视频的影调和画质也得到优化,人物动作更加连贯。此次升级还带来了更多样化的视频风格,包括彩铅、积木、黑白素描、像素和3D动画等。该功能由豆包的Seedance模型支持,用户可通过豆包App和网页端免费体验通过文字或图片生成高质量视频。
5、蚂蚁数科发布金融智能体开发平台Agentar,内测上线超百个金融MCP服务
蚂蚁数科正式发布金融智能体开发平台Agentar,为金融机构提供一站式、全栈的智能体开发工具,旨在高效打造自主决策、可信可靠的金融智能体应用。Agentar依托蚂蚁集团在金融级场景中积累的AI技术能力,提供算力调度、数据治理、模型训推及应用落地等服务,并结合高质量金融知识库和低代码可视化编排能力,降低智能体搭建门槛。平台内测上线了国内首个金融MCP服务广场,包含超百个核心金融MCP服务及行业know-how组件库,并具备金融级安全合规保障。蚂蚁数科致力于通过Agentar推动金融服务迈向智慧化时代。
6、暗月之面开源Kimi-VL模型:2.8亿参数处理文本、图像和视频,媲美大型模型
中国初创公司Moonshot AI发布开源多模态模型Kimi-VL,仅用2.8亿活跃参数即展现出处理图像、文本和视频的卓越能力,并在多项基准测试中媲美大型模型。Kimi-VL擅长处理长文档、复杂推理和用户界面,其128K tokens的上下文窗口使其能处理整本书籍或长视频记录。该模型采用混合专家架构,仅激活部分参数,实现了高效性能。Moonshot AI强调其训练方法结合了监督微调和强化学习,未来计划开发更大规模版本以应用于科研和工业领域。Kimi-VL的演示版本已在Hugging Face上线。
7、Gen-4References惊艳发布:AI实时混合图像,精准控制光影氛围
Gen-4References是一种新兴的AI图像生成技术,能够实时融合两张参考图像,并根据用户描述的构图需求生成新图像,精准保留环境光影并支持复杂主体定位。该技术基于先进的生成模型和图像处理技术,实现了动态图像混合和光影一致性,并支持高分辨率输出和用户友好的文本驱动交互。其在数字艺术、影视游戏、电商广告等领域展现出广泛的应用潜力,有望超越传统图像编辑工具,为AI创作带来新的突破。目前该技术尚处于测试阶段,具体平台和定价待公布。