大模型本周进展(0623~0629)
更多详情和历史整理:飞书文档
一、技术进展
(一)模型发布与升级
- 腾讯混元 - A13B模型发布并开源:基于专家混合(MoE)架构,参数规模800亿。该架构使其推理效率高,支持快思考和慢思考模式,在数学、科学和逻辑推理任务中表现优异。由于其推理效率优势,适合中低端GPU部署,降低了AI应用在硬件上的门槛,有利于推动相关模型在中小企业和科研机构的普及 。
- MiniMax发布视频生成模型Hailuo 02:在多模态领域实现重大突破,刷新国内图生视频、文生视频榜单排名。其核心采用创新的Noise - aware Compute Redistribution(NCR)架构,在模型参数和训练数据量分别提升3倍和4倍的同时,效率提升2.5倍。能输出原生1080P高清画质的电影级视频画面,在复杂物理场景表现突出,如体操运动员空中连续翻转、马戏演员喷火时火花与光影互动等场景的呈现上具有领先优势,在Artificial Analysis视频竞技场中位居全球第二,力压快手可灵和谷歌Veo 3,仅次于字节跳动Seedance 1.0 。
- 字节跳动豆包大模型升级至1.6版本:推理、数学、指令遵循能力大幅提升。新版本支持多模态理解,意味着可以处理包括文本、图像、音频等多种类型的数据,并且支持图形界面操作,使用户能够更直观地与模型进行交互,达到全球领先水平,为用户提供了更强大且易用的AI服务 。
- 谷歌Gemini新增视频上传与分析功能:支持安卓和网页端用户上传视频,进行内容概述和片段查找。这一功能拓展了视频智能分析能力,用户可以通过简单的上传操作,获取视频的关键信息总结以及快速定位到感兴趣的片段,提升了视频内容处理的效率 。
(二)其他技术突破
- 研究公司Snowflake公布SwiftKV技术:该技术核心在于优化模型提示词处理过程。通常大模型处理用户输入提示词环节消耗大量计算资源,尤其企业自定义的长提示词问题突出。SwiftKV技术专门针对预制提示词处理优化,突破传统键值(Key - Value,KV)缓存压缩技术,在模型推理过程中引入模型重组与知识保存自我蒸馏方法,有效提升模型吞吐量、降低延迟和运算成本。实验显示,利用该技术优化Llama 3.1的80亿和700亿参数模型后,整体吞吐量可提升两倍,在代码自动补全、文本摘要等方面表现出色 。
二、产品应用
- LinkedIn全新AI求职搜索功能上线:利用生成式AI技术,支持自然语言描述求职意向。求职者可以用日常语言描述自己期望的工作岗位、行业、地点等信息,系统能够更精准地理解意图,提高招聘效率和匹配精准度,减少求职者与招聘方在信息匹配上的时间成本 。
- 中国通号通信信息集团“铁路通信智能助手”成功部署应用:针对铁路通信领域长期存在的“数据孤岛”难题,系统创造性融合Deepseek大模型平台与多模态知识图谱技术。通过多源数据采集,汇聚知识洪流,能精准识别文档主题、所属业务领域、关键信息等,建立高效智能知识管理系统。99.95%超高精度的自动更新机制,让专业技术标准、设备参数、故障案例等核心数据实现灵活应用。通过深度整合先进的DeepSeek能力融合方案,构建动态更新的铁路专属知识图谱,采用分布式存储架构,具备强大扩展性和高可用性,突破传统关键词搜索局限,精准解析搜索意图,提升日常工作效率,减少工作延误 。
- 软通动力联合华为云发布AI知识引擎与数据工程融合创新解决方案:在华为开发者大会2025中,以华为云昇腾AI、盘古大模型、ModelArts等为技术底座,全新升级数据治理基线解决方案。发布的方案包括软通动力TianxuanAIDE - AI数据治理平台、TianxuanAIDE - AI数据工程平台,基于华为云底座的DataAgent解决方案、AI知识引擎解决方案,实现数据治理、知识萃取、智能应用的全场景闭环 。
- 当贝AI上新共享知识库:作为国内最早一批接入DeepSeek R1 0528模型的智能平台,已构建涵盖DeepSeek R1 671B联网满血版、DeepSeek V3等头部大模型的生态矩阵。共享知识库功能依托自研“多模型聚合引擎”,实现DeepSeek R1 671B、通义千问、豆包等模型自由切换。在数据安全上延续“本地优先”策略,敏感数据端侧处理,授权后加密交互。在企业场景中,销售团队可生成个性化销售话术,客服部门能快速调取资料;教育场景下,教师可获取教学建议,学生能查询知识点;科研及兴趣领域,科研人员可上传数据文献,兴趣爱好者能得到多格式文件解析建议 。
三、资本运作
- AI初创公司Thinking Machines Lab完成20亿美元种子轮融资:创下历史最大种子轮纪录,估值达100亿美元。如此大规模的融资凸显全球AI人才争夺激烈,也反映出资本市场对AI初创企业的高度看好,大量资金的注入将为该公司在技术研发、人才招募等方面提供强大支持 。
- 2025年上半年AI芯片投资超200亿美元:传统巨头与新兴企业均加大研发投入。这表明AI芯片作为AI技术发展的重要支撑,受到各方高度重视,持续的资金投入将推动AI算力持续提升,为AI应用的拓展和深化提供硬件基础 。
- Synthesia融资9000万美元:这家英国AI初创公司成立于2017年,由AI研究人员和企业家团队创立,使命是让用户无需相机、麦克风或工作室就能制作视频内容,已被Teleperformance、BBC、亚马逊、路透社和BSH等公司使用。通过生成逼真的合成人物并直接根据脚本制作视频(文本转视频,TTV),已成功创建与真实个体极为相似的合成人类。此轮融资由风险投资公司Accel和英伟达旗下的NVentures领投,公司估值达10亿美元 。
四、行业合作
- 美国国防部与OpenAI签订2亿美元合同:双方将合作开发AI工具应对国家安全挑战,项目预计2026年7月完成。这一合作标志着AI技术在国防领域的深度应用,AI技术将为国家安全相关的情报分析、军事决策等方面提供支持 。
五、前沿探索
- Neuralink发布脑机接口最新进展:全球已有7人植入设备,实现意念操控。计划在2026年恢复视觉,2028年实现人机深度融合。脑机接口技术的发展将为人类与机器的交互带来革命性变化,在医疗康复、神经科学研究以及未来人机协同等领域具有巨大潜力 。
六、企业动态
- 英特尔大规模裁员并退出汽车芯片业务:为扭转财务困境,裁员涉及芯片设计核心岗位和汽车业务,未来将聚焦核心领域研发。这一举措是英特尔在面临市场竞争和财务压力下的战略调整,旨在集中资源发展优势业务 。
七、行业会议
- 夏季达沃斯论坛聚焦AI + 企业发展:行业领袖强调以场景应用为牵引,推动制造业智能化转型。会议为AI企业、制造业企业以及相关专家学者提供交流平台,探讨如何将AI技术更好地应用于企业实际生产运营中,加速制造业从传统模式向智能化模式转变 。