当前位置：首页 > news >正文

大模型本周进展（0623~0629）

news 来源：原创 2025/6/30 7:05:29

更多详情和历史整理：飞书文档

一、技术进展

（一）模型发布与升级

腾讯混元 - A13B模型发布并开源：基于专家混合（MoE）架构，参数规模800亿。该架构使其推理效率高，支持快思考和慢思考模式，在数学、科学和逻辑推理任务中表现优异。由于其推理效率优势，适合中低端GPU部署，降低了AI应用在硬件上的门槛，有利于推动相关模型在中小企业和科研机构的普及。
MiniMax发布视频生成模型Hailuo 02：在多模态领域实现重大突破，刷新国内图生视频、文生视频榜单排名。其核心采用创新的Noise - aware Compute Redistribution（NCR）架构，在模型参数和训练数据量分别提升3倍和4倍的同时，效率提升2.5倍。能输出原生1080P高清画质的电影级视频画面，在复杂物理场景表现突出，如体操运动员空中连续翻转、马戏演员喷火时火花与光影互动等场景的呈现上具有领先优势，在Artificial Analysis视频竞技场中位居全球第二，力压快手可灵和谷歌Veo 3，仅次于字节跳动Seedance 1.0 。
字节跳动豆包大模型升级至1.6版本：推理、数学、指令遵循能力大幅提升。新版本支持多模态理解，意味着可以处理包括文本、图像、音频等多种类型的数据，并且支持图形界面操作，使用户能够更直观地与模型进行交互，达到全球领先水平，为用户提供了更强大且易用的AI服务。
谷歌Gemini新增视频上传与分析功能：支持安卓和网页端用户上传视频，进行内容概述和片段查找。这一功能拓展了视频智能分析能力，用户可以通过简单的上传操作，获取视频的关键信息总结以及快速定位到感兴趣的片段，提升了视频内容处理的效率。

（二）其他技术突破

研究公司Snowflake公布SwiftKV技术：该技术核心在于优化模型提示词处理过程。通常大模型处理用户输入提示词环节消耗大量计算资源，尤其企业自定义的长提示词问题突出。SwiftKV技术专门针对预制提示词处理优化，突破传统键值（Key - Value，KV）缓存压缩技术，在模型推理过程中引入模型重组与知识保存自我蒸馏方法，有效提升模型吞吐量、降低延迟和运算成本。实验显示，利用该技术优化Llama 3.1的80亿和700亿参数模型后，整体吞吐量可提升两倍，在代码自动补全、文本摘要等方面表现出色。

二、产品应用

LinkedIn全新AI求职搜索功能上线：利用生成式AI技术，支持自然语言描述求职意向。求职者可以用日常语言描述自己期望的工作岗位、行业、地点等信息，系统能够更精准地理解意图，提高招聘效率和匹配精准度，减少求职者与招聘方在信息匹配上的时间成本。
中国通号通信信息集团“铁路通信智能助手”成功部署应用：针对铁路通信领域长期存在的“数据孤岛”难题，系统创造性融合Deepseek大模型平台与多模态知识图谱技术。通过多源数据采集，汇聚知识洪流，能精准识别文档主题、所属业务领域、关键信息等，建立高效智能知识管理系统。99.95%超高精度的自动更新机制，让专业技术标准、设备参数、故障案例等核心数据实现灵活应用。通过深度整合先进的DeepSeek能力融合方案，构建动态更新的铁路专属知识图谱，采用分布式存储架构，具备强大扩展性和高可用性，突破传统关键词搜索局限，精准解析搜索意图，提升日常工作效率，减少工作延误。
软通动力联合华为云发布AI知识引擎与数据工程融合创新解决方案：在华为开发者大会2025中，以华为云昇腾AI、盘古大模型、ModelArts等为技术底座，全新升级数据治理基线解决方案。发布的方案包括软通动力TianxuanAIDE - AI数据治理平台、TianxuanAIDE - AI数据工程平台，基于华为云底座的DataAgent解决方案、AI知识引擎解决方案，实现数据治理、知识萃取、智能应用的全场景闭环。
当贝AI上新共享知识库：作为国内最早一批接入DeepSeek R1 0528模型的智能平台，已构建涵盖DeepSeek R1 671B联网满血版、DeepSeek V3等头部大模型的生态矩阵。共享知识库功能依托自研“多模型聚合引擎”，实现DeepSeek R1 671B、通义千问、豆包等模型自由切换。在数据安全上延续“本地优先”策略，敏感数据端侧处理，授权后加密交互。在企业场景中，销售团队可生成个性化销售话术，客服部门能快速调取资料；教育场景下，教师可获取教学建议，学生能查询知识点；科研及兴趣领域，科研人员可上传数据文献，兴趣爱好者能得到多格式文件解析建议。

三、资本运作

AI初创公司Thinking Machines Lab完成20亿美元种子轮融资：创下历史最大种子轮纪录，估值达100亿美元。如此大规模的融资凸显全球AI人才争夺激烈，也反映出资本市场对AI初创企业的高度看好，大量资金的注入将为该公司在技术研发、人才招募等方面提供强大支持。
2025年上半年AI芯片投资超200亿美元：传统巨头与新兴企业均加大研发投入。这表明AI芯片作为AI技术发展的重要支撑，受到各方高度重视，持续的资金投入将推动AI算力持续提升，为AI应用的拓展和深化提供硬件基础。
Synthesia融资9000万美元：这家英国AI初创公司成立于2017年，由AI研究人员和企业家团队创立，使命是让用户无需相机、麦克风或工作室就能制作视频内容，已被Teleperformance、BBC、亚马逊、路透社和BSH等公司使用。通过生成逼真的合成人物并直接根据脚本制作视频（文本转视频，TTV），已成功创建与真实个体极为相似的合成人类。此轮融资由风险投资公司Accel和英伟达旗下的NVentures领投，公司估值达10亿美元。