文心大模型4.5及X1重磅上线,真实测评
2025年3月16日,人工智能领域迎来一场重要盛事——百度文心大模型4.5如期正式发布。与此同时,百度还惊喜推出了另一款全新模型——文心大模型X1。 目前,文心大模型4.5和X1已在文心一言官网(https://yiyan.baidu.com/)正式上线,并免费向用户开放。其中,文心大模型4.5面向企业用户和开发者,用户可以通过登录百度智能云千帆大模型平台,轻松调用文心大模型4.5的API接口,快速实现智能化应用的开发和部署。除了在文心一言官网和千帆平台上线外,文心大模型4.5和X1还将陆续接入百度搜索、文小言APP等产品。
官方介绍
文心大模型4.5:原生多模态基础大模型
文心大模型4.5是百度自主研发的新一代原生多模态基础大模型,通过多个模态联合建模实现协同优化,多模态理解能力优秀;具备更精进的语言能力,理解、生成、逻辑、记忆能力全面提升,去幻觉、逻辑推理、代码能力显著提升。
多模态能力
文本能力
文心大模型4.5具备优秀的多模态理解能力,能对文字、图片、音频、视频等内容进行综合理解。
不仅是“高智商”,文心大模型4.5也拥有“高情商”,网络梗图、讽刺漫画等等,理解起来都不在话下。
文心大模型4.5能力显著增强,离不开这些关键技术:
◎ FlashMask动态注意力掩码:加速大模型灵活注意力掩码计算,有效提升长序列建模能力和训练效率,优化长文处理能力和多轮交互表现;
◎ 多模态异构专家扩展技术:根据模态特点构建模态异构专家,结合自适应模态感知损失函数,解决不同模态梯度不均衡问题,提升多模态融合能力;
◎ 时空维度表征压缩技术:在时空维度对图片和视频的语义表征进行高效压缩,大幅提升多模态数据训练效率,增强了从长视频中吸取世界知识的能力;
◎ 基于知识点的大规模数据构建技术:基于知识分级采样、数据压缩与融合、稀缺知识点定向合成技术,构建高知识密度预训练数据,提升模型学习效率,大幅降低模型幻觉;
◎ 基于自反馈的Post-training技术:融合多种评价方式的自反馈迭代式后训练技术,全面提升强化学习稳定性和鲁棒性,大幅提升预训练模型对齐人类意图能力。
文心大模型X1:能力更全面的深度思考模型
文心大模型X1具备更强的理解、规划、反思、进化能力,并支持多模态,是首个自主运用工具的深度思考模型。作为能力更全面的深度思考模型,文心大模型X1兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。
作为能自主运用工具的大模型,文心大模型X1已支持高级搜索、文档问答、图片理解、AI绘图、代码解释器、网页链接读取、TreeMind树图、百度学术检索、商业信息查询、加盟信息查询等多款工具。
文心大模型X1能力的全面提升,得益于这些关键技术的支撑:
◎递进式强化学习训练方法:创新性地应用递进式强化学习方法,在创作、搜索、工具调用、推理等场景全面提升模型的综合应用能力;
◎基于思维链和行动链的端到端训练:针对深度搜索、工具调用等场景,根据结果反馈进行端到端的模型训练,显著提升训练效果;
◎ 多元统一的奖励系统:建立了统一的奖励系统,融合多种类型的奖励机制,为模型训练提供更加鲁棒的反馈。
小编实测
百度文心大模型4.5与文心大模型X1究竟表现如何?我们实测了这几个功能。
文心大模型4.5
1、图片解释
它能帮我分析出这张图片是哪个电视剧的截图,这人是谁扮演的,以及人物的内心活动。
2、图片生成
这图片真的很强,已经超出我的预期了~
3、推理能力
文心大模型4.5在推理任务中也展现出极强的能力。举个例子,315晚会之后大家都在喊话雷军做卫生巾,我们来看看假如小米做卫生巾会有什么亮点
再来让它设计一个包装
文心大模型X1
1、调用工具
X1最大的特色就是可以免费调用平台内置的工具,实现更多自动化能力。
以前我在生成词云图都需要借助python,现在可以直接使用
再来看看思维导图,以前基于DeepSeek+XMind,已经可以非常方便的生成思维导图了,但是想现在的X1,把这个动作再一次简化了。
2、文字生成
一般一个新的大模型出来,我们肯定是要测试一下它的文字生成能力的,毕竟无论是AI写文章还是写小说,都有着巨大的市场。
这不妥妥的自媒体人创业方向就来了~
此前,百度曾宣布文心一言将于4月1日免费,本次发布不仅带来两款全新大模型,且将免费时间提前,全面提升了用户体验。近期,百度在AI大模型方面动作频频,依此前预告显示,百度将在6月30日正式将文心大模型开源,并在今年下半年发布文心大模型5.0。
预告:文心大模型那么强大,小巨也会抓紧脚步,让巨人肩膀AI功能都尽快支持4.5模型~
点击体验巨人对话
巨人对话|巨人肩膀