当前位置: 首页 > news >正文

Meta LLaMA 4:对抗 GPT-4o 与 Claude 的开源王牌

2025 年 4 月,Meta 正式发布了 LLaMA 4 系列的首批两款模型。 

这两款模型模型分别是:LLaMA 4 Scout 与 LLaMA 4 Maverick,均采用了 专家混合架构(Mixture-of-Experts, MoE)。 

据 Meta 表示,这是首次有 LLaMA 模型实现 文字与图像的统一处理能力,具备真正意义上的多模态理解。 

据悉,在训练过程中,系统最多可同时处理 48 张图像;而在后续评估中,模型在处理多达 8 张图像的输入时,亦展现出稳定而强劲的视觉理解性能。 

LLaMA 4 系列:有哪些新突破?

Meta 于本次 LLaMA 4 发布中亮相了两款全新模型: 

1. LLaMA 4 Scout

这是一款轻量却不失强劲性能的模型,专为在单张 NVIDIA H100 GPU 上高效运行而优化,尤为适合科研人员与中小型企业应用。 

拥有 1000 万词元(token)的超长上下文窗口,远远领先于多数现有开源大语言模型。

在推理、摘要生成与指令遵循等标准评测中,全面超越 Google 的 Gemma 3 与 Mistral 3.1。

2.LLaMA 4 Maverick

这款大型模型则剑指当前语言模型的重量级选手,如 GPT-4o、Claude 3.5 与 DeepSeek-V3。 

精于代码生成、多跳推理与高级搜索任务。

采用 专家混合机制(Mixture-of-Experts, MoE),仅激活部分参数进行计算,在保持卓越表现的同时显著提升效率。

架构与创新亮点

两款模型皆构建于全新的 Transformer 2.0 架构之上,并在多个关键维度进行了深度优化: 

  • 专家混合机制(MoE):每次前向传播仅激活部分模型参数,有效降低计算开销,同时不牺牲性能。
  • 词元流式处理与预测解码(Speculative Decoding):显著提升推理速度。
  • 超长上下文窗口(Scout 模型支持高达 1000 万词元):可处理超大文档或多轮对话,效率倍增。
  • 多语言支持全面升级:在阿拉伯语、乌尔都语、西班牙语与中文等语言上的表现有了飞跃性提升。

相关文章:

  • 【教学类-102-05】蛋糕剪纸图案(留白边、沿线剪)04——Python白色(255)图片转为透明png再制作“点状边框和虚线边框”
  • BGP路由协议之属性1
  • 手搓多模态-06 数据预处理
  • 硬件设计中串联电阻的作用、阻值范围及选取方法详解
  • 如何正确使用 `apiStore` 进行 API 管理
  • 16-产品经理-需求的评审
  • Nmap全脚本使用指南!NSE脚本全详细教程!Kali Linux教程!(七)
  • 35.[前端开发-JavaScript基础]Day12-for循环中变量-华为商城-商品列表-轮播图
  • 心律异常检测
  • 以UE5第三方插件库为基础,编写自己的第三方库插件,并且能够在运行时复制.dll
  • 【内网渗透】Linux上线CS学习-CrossC2插件
  • Hybrid 架构的概念,以及如何优化Hybrid 通信方案,提升页面加载速度和渲染性能
  • 【c++深入系列】:类和对象详解(下)
  • SpringMVC的数据响应
  • 13-Leveldb快照原理及其实现
  • 嵌入式工程师多线程编程(四)裸机编程实现多任务调度
  • 2026考研数学张宇武忠祥复习视频课,高数基础班+讲义PDF
  • FreeCAD 使用的是 GNU Lesser General Public License (LGPL) 许可证
  • C# Winform 入门(14)之如何使用线程池
  • Kube Scheduler 可观测性最佳实践
  • 网站模版 源码之家/网站平台如何推广
  • 新建网站如何做关键词/营销型网站建设怎么做
  • 凡科做的网站/优化的含义
  • 东莞凤岗疫情/seo公司哪家好用
  • 自媒体网站程序/整合营销传播
  • 南京环力建设有限公司网站/百度论坛