当前位置: 首页 > news >正文

【AI News | 20250429】每日AI进展

AI Repos

1、aci
ACI.dev是一个开源基础设施层,旨在为AI智能体的工具使用提供支持。它通过统一的模型-上下文-协议(MCP)服务器或轻量级Python SDK,使智能体能够以感知意图的方式访问600多种工具,并具备多租户认证、细粒度权限和动态工具发现等功能。ACI.dev解决了构建生产级AI智能体时面临的基础设施难题,如大规模认证、工具发现和自然语言权限管理,支持各种LLM框架和智能体架构,并提供丰富的预构建集成,助力开发者快速构建功能强大的AI应用。
在这里插入图片描述

2、crawl4ai
Crawl4AI是一个流行的开源GitHub项目,专为LLMs、AI智能体和数据管道设计,提供高速、AI友好的Web爬取和数据抓取功能。它能生成优化的Markdown格式,速度比传统方法快6倍,并提供灵活的浏览器控制、启发式智能提取,无需API密钥即可部署。最新版本v0.6.0引入了世界感知爬取、表格数据提取、浏览器池化、网络流量捕获和MCP集成等新特性,并改进了Docker部署。Crawl4AI旨在通过开源工具 democratize 数据提取,赋能AI应用。

AI News

1、通义千问Qwen3发布:首创混合推理模式,性能全面提升并开源
通义千问团队发布新一代开源大语言模型Qwen3,包含稠密和混合专家(MoE)共八款不同规模模型,性能在代码、数学和通用能力基准测试中均表现出色,部分小模型性能甚至匹敌前代大模型。Qwen3首创“思考模式”与“非思考模式”混合推理,兼顾复杂推理和快速响应,并支持119种语言及方言。模型原生支持MCP协议,具备智能体能力和多模态扩展潜力。Qwen3以Apache2.0协议开源,提供高性能、低成本的AI解决方案,并已在Hugging Face、ModelScope等平台开放使用。

2、ChatGPT搜索新增网购功能:对话式个性化商品推荐
OpenAI在ChatGPT Search中新增网购功能,用户可通过自然对话获取时尚、美妆、家居和电子产品等个性化商品推荐,并直接查看图片、评价及购买链接,实现一站式购物。ChatGPT能记忆用户偏好,提供精准匹配,且商品推荐基于第三方数据,保证中立性。目前该功能处于测试阶段,未来将扩展更多商品类别,并同步推出引文改进和趋势话题追踪等搜索增强功能,有望革新线上购物体验。

3、新创公司Cheehoo推出AI动画工具,赋能艺术家与创作者
由梦工厂前总裁、苹果前科学家及Rideback联合创始人等行业资深人士创立的新兴公司Cheehoo正式上线beta版,致力于利用AI技术革新动画制作。Cheehoo旨在将AI的力量赋予艺术家和版权持有者,解决行业痛点,提供快速创建和迭代角色动画、保持艺术风格一致性及精确控制的能力,并兼容专业动画和游戏流程,同时保障数据和知识产权安全。公司的目标是赋能艺术家,借助AI工具简化动画制作流程,创造新一代动画品牌。

4、豆包视频生成功能升级:提升语义理解与多种风格
豆包宣布其视频生成功能迎来重大升级,显著提升了语义理解能力,使得生成的视频内容更贴合用户意图。同时,视频的影调和画质也得到优化,人物动作更加连贯。此次升级还带来了更多样化的视频风格,包括彩铅、积木、黑白素描、像素和3D动画等。该功能由豆包的Seedance模型支持,用户可通过豆包App和网页端免费体验通过文字或图片生成高质量视频。

5、蚂蚁数科发布金融智能体开发平台Agentar,内测上线超百个金融MCP服务
蚂蚁数科正式发布金融智能体开发平台Agentar,为金融机构提供一站式、全栈的智能体开发工具,旨在高效打造自主决策、可信可靠的金融智能体应用。Agentar依托蚂蚁集团在金融级场景中积累的AI技术能力,提供算力调度、数据治理、模型训推及应用落地等服务,并结合高质量金融知识库和低代码可视化编排能力,降低智能体搭建门槛。平台内测上线了国内首个金融MCP服务广场,包含超百个核心金融MCP服务及行业know-how组件库,并具备金融级安全合规保障。蚂蚁数科致力于通过Agentar推动金融服务迈向智慧化时代。

6、暗月之面开源Kimi-VL模型:2.8亿参数处理文本、图像和视频,媲美大型模型
中国初创公司Moonshot AI发布开源多模态模型Kimi-VL,仅用2.8亿活跃参数即展现出处理图像、文本和视频的卓越能力,并在多项基准测试中媲美大型模型。Kimi-VL擅长处理长文档、复杂推理和用户界面,其128K tokens的上下文窗口使其能处理整本书籍或长视频记录。该模型采用混合专家架构,仅激活部分参数,实现了高效性能。Moonshot AI强调其训练方法结合了监督微调和强化学习,未来计划开发更大规模版本以应用于科研和工业领域。Kimi-VL的演示版本已在Hugging Face上线。

7、Gen-4References惊艳发布:AI实时混合图像,精准控制光影氛围
Gen-4References是一种新兴的AI图像生成技术,能够实时融合两张参考图像,并根据用户描述的构图需求生成新图像,精准保留环境光影并支持复杂主体定位。该技术基于先进的生成模型和图像处理技术,实现了动态图像混合和光影一致性,并支持高分辨率输出和用户友好的文本驱动交互。其在数字艺术、影视游戏、电商广告等领域展现出广泛的应用潜力,有望超越传统图像编辑工具,为AI创作带来新的突破。目前该技术尚处于测试阶段,具体平台和定价待公布。

相关文章:

  • OpenCV 图形API(71)图像与通道拼接函数-----从图像(GMat)中裁剪出一个矩形区域的操作函数 crop()
  • gitee 如何修改提交代码的邮箱
  • 训练神经网络的批量标准化(使用 PyTorch)
  • 内核常见问题汇总
  • 计算机基础:二进制基础14,二进制加法
  • 某建筑石料用灰岩矿自动化监测
  • 海思vio模块学习
  • Android第五次面试总结之网络篇(修)
  • 【AI】OrinNX上安装RIVA-2.19.0,实现文本转语音
  • 第14讲:科研图表的导出与排版艺术——高质量 PDF、TIFF 输出与投稿规范全攻略!
  • 水安题库:水利水电安全员ABC精选练习题
  • MySQL多表操作
  • HCIE证书失效?续证流程与影响全解析
  • 一个SciPy图像处理案例的全过程
  • 小结:GRE VPN;IPSec
  • 【论文阅读/复现】RT-DETR的网络结构/训练/推理/验证/导出模型
  • 抱佛脚之学SSMSpringMVC数据绑定
  • JavaScript 作用域全面总结
  • Spring MVC 中解决中文乱码问题
  • 近期实践总结
  • 专访|200余起诉讼,特朗普上台100天,美国已进入宪政危机
  • 外交部回应涉长江和记出售巴拿马运河港口交易:望有关各方审慎行事,充分沟通
  • 美加征“对等关税”后,调研显示近半外贸企业将减少对美业务
  • 幸福航空取消“五一”前航班,财务人员透露“没钱飞了”
  • 民航局答澎湃:督促各单位进一步完善航班大面积延误和大面积备降应急处置预案
  • 国家核安全局局长:我国核电进入大规模建设高峰期,在建规模超其他国家总和