当前位置：首页 > news >正文

【AI News | 20250707】每日AI进展

news 2025/11/15 9:20:18

AI Repos

1、litgpt
LitGPT是一个开源框架，提供20多款高性能大语言模型（LLMs）的从头实现，支持预训练、微调及大规模部署。它强调无抽象、易于调试、支持大规模部署和性能优化，通过Flash Attention、FSDP、LoRA等技术，优化GPU资源占用，并支持多GPU/TPU。用户可轻松安装、加载和使用LLMs，并进行微调、预训练、评估和部署等多种工作流。LitGPT还提供经过验证的训练配置，旨在帮助开发者快速、高效地构建和应用LLMs。

AI News

1、飞渡科技发布’峥嵘大模型’
飞渡科技最新发布的’峥嵘大模型’在国际评测平台City3D中表现卓越，特别是在建模精度和语义理解能力方面位居全球前列。这一技术突破为灾害模拟、文化遗产保护等领域提供了精确的数据支持，同时飞渡科技计划开放Demo和API，促进更多创新应用的开发，推动行业智能化进程。

2、中国科学院推出Stream-Omni多模态大模型
中国科学院计算技术研究所自然语言处理团队开发的Stream-Omni多模态大模型，基于GPT-4o架构，支持文本、视觉和语音三种模态的交互，通过创新的模态关系建模和语音-文本映射机制，实现了高效的模态对齐和灵活的交互体验。该模型在视觉理解和语音交互方面表现出色，为多模态智能交互技术的发展奠定了基础。

3、智元公司推出双形态哪吒机器人灵犀X2-N
智元公司近日发布了创新型机器人产品——哪吒机器人灵犀X2-N，其最大亮点在于独特的双形态设计，能够在轮式和足式之间自由切换，以适应不同的应用场景和复杂地形。在足式状态下展现出卓越的越障能力和强大的负载平衡性能，而在轮式形态下则能实现高效移动和灵活转向，抗冲击能力强，显著提升了在复杂环境下的可靠性。

4、腾讯开源混元-A13B语言模型：动态推理与MoE架构
腾讯近日宣布开源其全新语言模型“混元-A13B”，该模型采用创新的动态推理方法和混合专家（MoE）架构，引入动态推理机制，支持高达256，000个标记的上下文窗口。在20万亿个token的训练基础上，特别优化了STEM领域的数据处理能力，其“混元-A13B-Instruct”版本在性能上与OpenAI、Deepseek等领先模型相媲美，在数学任务中取得较好评估结果。

5、开源AI桌面助手Glass：改变数字交互方式
近日，由Pickle团队开发的Glass开源AI桌面助手迅速走红，专为macOS设计，能在后台实时捕捉屏幕和音频活动，智能分析并转化为结构化知识，提升效率。其核心功能包括实时生成会议记录与摘要，强大的上下文理解能力整理零散信息为知识库，且设计隐形保障隐私。Glass的开源版本已上架GitHub，展现出在工作和AI应用开发中的巨大潜力。

6、谷歌Gemini CLI最新版本发布：音视频处理与隐私保护全面升级
谷歌开源的命令行工具Gemini CLI于2025年7月初发布了最新版本，新增音视频内容支持和Markdown功能大升级，同时加强了隐私保护和用户体验优化。此次更新由51位社区贡献者共同完成，展现了其开源生态的活跃与强大。Gemini CLI的这次更新不仅提升了功能、兼容性和稳定性，还为开发者提供了更高效、更灵活的工作体验。

7、开源多模态大模型EarthMind：革新地球观测数据分析的未来
意大利特伦托大学、德国柏林工业大学及慕尼黑工业大学的研究团队联合推出开源多模态大模型EarthMind，旨在高效分析和理解复杂的地球观测数据。该模型通过引入空间注意力提示（SAP）模块和跨模态融合技术，提升了像素级理解的精准度，实现了不同传感器数据的有效整合与分析，为自然灾害监测和城市发展规划等领域提供了重要的决策依据。

8、字节跳动开源AI原生IDE核心组件Trae-Agent，携手开发者共建智能体生态系统
字节跳动宣布开源其AI原生集成开发环境（IDE）Trae的核心组件Trae-Agent，这是一个基于大语言模型（LLM）的智能体，专注于通用的软件工程任务。Trae-Agent通过命令行界面(CLI)理解自然语言指令，连接多种工具和LLM服务提供商，执行复杂工作流，旨在提升开发效率和灵活性。目前项目处于alpha阶段，字节跳动期待更多开发者加入，共同推动智能体生态系统的构建和发展。

9、B站开源动漫视频生成模型AniSora V3重磅更新，助力创作者高效制作高质量动漫内容
B站近日宣布其开源的动漫视频生成模型AniSora迎来V3版本的重大更新，该版本通过引入时空掩码模块和强化学习与人类反馈技术，优化了画面连续性，同时扩展了动漫风格的多样性。AniSora V3支持多风格动漫视频生成，新增对华为Ascend910B NPU的支持，推理速度提升约20%，为动漫、漫画和VTuber内容创作者提供更多可选工具。