当前位置: 首页 > news >正文

【AI News | 20250707】每日AI进展

AI Repos

1、litgpt
LitGPT是一个开源框架,提供20多款高性能大语言模型(LLMs)的从头实现,支持预训练、微调及大规模部署。它强调无抽象、易于调试、支持大规模部署和性能优化,通过Flash Attention、FSDP、LoRA等技术,优化GPU资源占用,并支持多GPU/TPU。用户可轻松安装、加载和使用LLMs,并进行微调、预训练、评估和部署等多种工作流。LitGPT还提供经过验证的训练配置,旨在帮助开发者快速、高效地构建和应用LLMs。

AI News

1、飞渡科技发布’峥嵘大模型’
飞渡科技最新发布的’峥嵘大模型’在国际评测平台City3D中表现卓越,特别是在建模精度和语义理解能力方面位居全球前列。这一技术突破为灾害模拟、文化遗产保护等领域提供了精确的数据支持,同时飞渡科技计划开放Demo和API,促进更多创新应用的开发,推动行业智能化进程。

2、中国科学院推出Stream-Omni多模态大模型
中国科学院计算技术研究所自然语言处理团队开发的Stream-Omni多模态大模型,基于GPT-4o架构,支持文本、视觉和语音三种模态的交互,通过创新的模态关系建模和语音-文本映射机制,实现了高效的模态对齐和灵活的交互体验。该模型在视觉理解和语音交互方面表现出色,为多模态智能交互技术的发展奠定了基础。

3、智元公司推出双形态哪吒机器人灵犀X2-N
智元公司近日发布了创新型机器人产品——哪吒机器人灵犀X2-N,其最大亮点在于独特的双形态设计,能够在轮式和足式之间自由切换,以适应不同的应用场景和复杂地形。在足式状态下展现出卓越的越障能力和强大的负载平衡性能,而在轮式形态下则能实现高效移动和灵活转向,抗冲击能力强,显著提升了在复杂环境下的可靠性。

4、腾讯开源混元-A13B语言模型:动态推理与MoE架构
腾讯近日宣布开源其全新语言模型“混元-A13B”,该模型采用创新的动态推理方法和混合专家(MoE)架构,引入动态推理机制,支持高达256,000个标记的上下文窗口。在20万亿个token的训练基础上,特别优化了STEM领域的数据处理能力,其“混元-A13B-Instruct”版本在性能上与OpenAI、Deepseek等领先模型相媲美,在数学任务中取得较好评估结果。

5、开源AI桌面助手Glass:改变数字交互方式
近日,由Pickle团队开发的Glass开源AI桌面助手迅速走红,专为macOS设计,能在后台实时捕捉屏幕和音频活动,智能分析并转化为结构化知识,提升效率。其核心功能包括实时生成会议记录与摘要,强大的上下文理解能力整理零散信息为知识库,且设计隐形保障隐私。Glass的开源版本已上架GitHub,展现出在工作和AI应用开发中的巨大潜力。

6、谷歌Gemini CLI最新版本发布:音视频处理与隐私保护全面升级
谷歌开源的命令行工具Gemini CLI于2025年7月初发布了最新版本,新增音视频内容支持和Markdown功能大升级,同时加强了隐私保护和用户体验优化。此次更新由51位社区贡献者共同完成,展现了其开源生态的活跃与强大。Gemini CLI的这次更新不仅提升了功能、兼容性和稳定性,还为开发者提供了更高效、更灵活的工作体验。

7、开源多模态大模型EarthMind:革新地球观测数据分析的未来
意大利特伦托大学、德国柏林工业大学及慕尼黑工业大学的研究团队联合推出开源多模态大模型EarthMind,旨在高效分析和理解复杂的地球观测数据。该模型通过引入空间注意力提示(SAP)模块和跨模态融合技术,提升了像素级理解的精准度,实现了不同传感器数据的有效整合与分析,为自然灾害监测和城市发展规划等领域提供了重要的决策依据。

8、字节跳动开源AI原生IDE核心组件Trae-Agent,携手开发者共建智能体生态系统
字节跳动宣布开源其AI原生集成开发环境(IDE)Trae的核心组件Trae-Agent,这是一个基于大语言模型(LLM)的智能体,专注于通用的软件工程任务。Trae-Agent通过命令行界面(CLI)理解自然语言指令,连接多种工具和LLM服务提供商,执行复杂工作流,旨在提升开发效率和灵活性。目前项目处于alpha阶段,字节跳动期待更多开发者加入,共同推动智能体生态系统的构建和发展。

9、B站开源动漫视频生成模型AniSora V3重磅更新,助力创作者高效制作高质量动漫内容
B站近日宣布其开源的动漫视频生成模型AniSora迎来V3版本的重大更新,该版本通过引入时空掩码模块和强化学习与人类反馈技术,优化了画面连续性,同时扩展了动漫风格的多样性。AniSora V3支持多风格动漫视频生成,新增对华为Ascend910B NPU的支持,推理速度提升约20%,为动漫、漫画和VTuber内容创作者提供更多可选工具。

文章内容引用自:jungleBlog

http://www.dtcms.com/a/269792.html

相关文章:

  • C++ dijkstra 最短路径算法
  • c语言学习_函数递归
  • 数学建模:非线性规划:凸规划问题
  • 【AI智能体】智能音视频-基于乐鑫 ESP32 实现音视频通话
  • ICML 2025 | TimeBridge : 巧妙化解非平稳性难题,精准预测长短结合!
  • Redis:高性能内存数据库与缓存利器
  • 验证KANO问题时合适的行为指标(如点击率、转化率等)来匹配问卷目标的一些尝试
  • 【论文翻译】用于大感受野的小波卷积 Wavelet Convolutions for Large Receptive Fields
  • 一天一道Sql题(day01)
  • Java武林:虚拟机之道 第二章:心法传承 - 类加载机制
  • three案例 Three.js波纹效果演示
  • “Jmeter中 xxx.jtl:1:1: Fatal Error! 前言中不允许有内容”的解决办法
  • 开源 SIP 协议栈介绍
  • INNER JOIN, LEFT JOIN, RIGHT JOIN 的区别
  • 字节面试被问到“手机号存储选 Int 还是 String”!
  • 区块链技术促进算力生态发展的具体案例
  • Python 机器学习核心入门与实战进阶 Day 6 - 模型保存与加载(joblib / pickle)
  • 2025年Linux安装MySQL详细教程
  • mysql-笔记
  • 服务器经常出现蓝屏是什么原因导致的?如何排查和修复?
  • Nature子刊:EPFL-ANU团队实现晶格对称性编程手性,双通道光学加密动态范围创1.6新高
  • Element-Plus-全局自动引入图标组件,无需每次import
  • 集群与集群应用
  • 东南亚主播解决方案|东南亚 TikTok 直播专线:纯净住宅 IP 、直播不卡顿
  • Spring自动装配(xml)
  • 芯片之后,AI之争的下一个战场是能源?
  • 小架构step系列08:logback.xml的配置
  • 知识库中如何确实嵌入文本块大小?语义完整性与检索颗粒度的平衡机制
  • 聊一聊软件架构师
  • C++排序算法全解析(加强版)