当前位置: 首页 > news >正文

大模型本周进展(0623~0629)

更多详情和历史整理:飞书文档

一、技术进展

(一)模型发布与升级

  1. 腾讯混元 - A13B模型发布并开源:基于专家混合(MoE)架构,参数规模800亿。该架构使其推理效率高,支持快思考和慢思考模式,在数学、科学和逻辑推理任务中表现优异。由于其推理效率优势,适合中低端GPU部署,降低了AI应用在硬件上的门槛,有利于推动相关模型在中小企业和科研机构的普及 。
  2. MiniMax发布视频生成模型Hailuo 02:在多模态领域实现重大突破,刷新国内图生视频、文生视频榜单排名。其核心采用创新的Noise - aware Compute Redistribution(NCR)架构,在模型参数和训练数据量分别提升3倍和4倍的同时,效率提升2.5倍。能输出原生1080P高清画质的电影级视频画面,在复杂物理场景表现突出,如体操运动员空中连续翻转、马戏演员喷火时火花与光影互动等场景的呈现上具有领先优势,在Artificial Analysis视频竞技场中位居全球第二,力压快手可灵和谷歌Veo 3,仅次于字节跳动Seedance 1.0 。
  3. 字节跳动豆包大模型升级至1.6版本:推理、数学、指令遵循能力大幅提升。新版本支持多模态理解,意味着可以处理包括文本、图像、音频等多种类型的数据,并且支持图形界面操作,使用户能够更直观地与模型进行交互,达到全球领先水平,为用户提供了更强大且易用的AI服务 。
  4. 谷歌Gemini新增视频上传与分析功能:支持安卓和网页端用户上传视频,进行内容概述和片段查找。这一功能拓展了视频智能分析能力,用户可以通过简单的上传操作,获取视频的关键信息总结以及快速定位到感兴趣的片段,提升了视频内容处理的效率 。

(二)其他技术突破

  1. 研究公司Snowflake公布SwiftKV技术:该技术核心在于优化模型提示词处理过程。通常大模型处理用户输入提示词环节消耗大量计算资源,尤其企业自定义的长提示词问题突出。SwiftKV技术专门针对预制提示词处理优化,突破传统键值(Key - Value,KV)缓存压缩技术,在模型推理过程中引入模型重组与知识保存自我蒸馏方法,有效提升模型吞吐量、降低延迟和运算成本。实验显示,利用该技术优化Llama 3.1的80亿和700亿参数模型后,整体吞吐量可提升两倍,在代码自动补全、文本摘要等方面表现出色 。

二、产品应用

  1. LinkedIn全新AI求职搜索功能上线:利用生成式AI技术,支持自然语言描述求职意向。求职者可以用日常语言描述自己期望的工作岗位、行业、地点等信息,系统能够更精准地理解意图,提高招聘效率和匹配精准度,减少求职者与招聘方在信息匹配上的时间成本 。
  2. 中国通号通信信息集团“铁路通信智能助手”成功部署应用:针对铁路通信领域长期存在的“数据孤岛”难题,系统创造性融合Deepseek大模型平台与多模态知识图谱技术。通过多源数据采集,汇聚知识洪流,能精准识别文档主题、所属业务领域、关键信息等,建立高效智能知识管理系统。99.95%超高精度的自动更新机制,让专业技术标准、设备参数、故障案例等核心数据实现灵活应用。通过深度整合先进的DeepSeek能力融合方案,构建动态更新的铁路专属知识图谱,采用分布式存储架构,具备强大扩展性和高可用性,突破传统关键词搜索局限,精准解析搜索意图,提升日常工作效率,减少工作延误 。
  3. 软通动力联合华为云发布AI知识引擎与数据工程融合创新解决方案:在华为开发者大会2025中,以华为云昇腾AI、盘古大模型、ModelArts等为技术底座,全新升级数据治理基线解决方案。发布的方案包括软通动力TianxuanAIDE - AI数据治理平台、TianxuanAIDE - AI数据工程平台,基于华为云底座的DataAgent解决方案、AI知识引擎解决方案,实现数据治理、知识萃取、智能应用的全场景闭环 。
  4. 当贝AI上新共享知识库:作为国内最早一批接入DeepSeek R1 0528模型的智能平台,已构建涵盖DeepSeek R1 671B联网满血版、DeepSeek V3等头部大模型的生态矩阵。共享知识库功能依托自研“多模型聚合引擎”,实现DeepSeek R1 671B、通义千问、豆包等模型自由切换。在数据安全上延续“本地优先”策略,敏感数据端侧处理,授权后加密交互。在企业场景中,销售团队可生成个性化销售话术,客服部门能快速调取资料;教育场景下,教师可获取教学建议,学生能查询知识点;科研及兴趣领域,科研人员可上传数据文献,兴趣爱好者能得到多格式文件解析建议 。

三、资本运作

  1. AI初创公司Thinking Machines Lab完成20亿美元种子轮融资:创下历史最大种子轮纪录,估值达100亿美元。如此大规模的融资凸显全球AI人才争夺激烈,也反映出资本市场对AI初创企业的高度看好,大量资金的注入将为该公司在技术研发、人才招募等方面提供强大支持 。
  2. 2025年上半年AI芯片投资超200亿美元:传统巨头与新兴企业均加大研发投入。这表明AI芯片作为AI技术发展的重要支撑,受到各方高度重视,持续的资金投入将推动AI算力持续提升,为AI应用的拓展和深化提供硬件基础 。
  3. Synthesia融资9000万美元:这家英国AI初创公司成立于2017年,由AI研究人员和企业家团队创立,使命是让用户无需相机、麦克风或工作室就能制作视频内容,已被Teleperformance、BBC、亚马逊、路透社和BSH等公司使用。通过生成逼真的合成人物并直接根据脚本制作视频(文本转视频,TTV),已成功创建与真实个体极为相似的合成人类。此轮融资由风险投资公司Accel和英伟达旗下的NVentures领投,公司估值达10亿美元 。

四、行业合作

  1. 美国国防部与OpenAI签订2亿美元合同:双方将合作开发AI工具应对国家安全挑战,项目预计2026年7月完成。这一合作标志着AI技术在国防领域的深度应用,AI技术将为国家安全相关的情报分析、军事决策等方面提供支持 。

五、前沿探索

  1. Neuralink发布脑机接口最新进展:全球已有7人植入设备,实现意念操控。计划在2026年恢复视觉,2028年实现人机深度融合。脑机接口技术的发展将为人类与机器的交互带来革命性变化,在医疗康复、神经科学研究以及未来人机协同等领域具有巨大潜力 。

六、企业动态

  1. 英特尔大规模裁员并退出汽车芯片业务:为扭转财务困境,裁员涉及芯片设计核心岗位和汽车业务,未来将聚焦核心领域研发。这一举措是英特尔在面临市场竞争和财务压力下的战略调整,旨在集中资源发展优势业务 。

七、行业会议

  1. 夏季达沃斯论坛聚焦AI + 企业发展:行业领袖强调以场景应用为牵引,推动制造业智能化转型。会议为AI企业、制造业企业以及相关专家学者提供交流平台,探讨如何将AI技术更好地应用于企业实际生产运营中,加速制造业从传统模式向智能化模式转变 。

相关文章:

  • WSL安装发行版上安装podman
  • 常用期权定价模型
  • AI金融科技/区块链合规相关研究的经验
  • 力扣第85题-最大矩形
  • Java中对JSON的操作
  • StarRocks 3.5 新特性解读:Snapshot 快照恢复、大导入性能全面升级、分区管理更智能
  • redisson看门狗实现原理
  • OD 算法题 B卷【阿里巴巴找黄金宝箱4】
  • Vue 与react 生命周期对比
  • 机器学习-02(深度学习的基本概念)
  • chapter02_AbstractBeanfactory与模板方法
  • 力扣第87题-扰乱字符串
  • 支持向量机(SVM)在医疗诊断:医学影像领域的应用与实现
  • 现代 JavaScript (ES6+) 入门到实战(八):总结与展望 - 成为一名现代前端开发者
  • 现代 JavaScript (ES6+) 入门到实战(五):告别回调地狱,Promise 完全入门
  • PCB工艺学习与总结-20250628
  • Ubuntu20 编译安装 Redis7.2.4
  • MySQL 安装使用教程
  • Ubuntu22 安装 RTX 5070 Ti Nvidia Driver 驱动
  • NeRF-Lidar实景重建:大疆Mavic 4 Pro低成本建模方案(2025实战指南)