当前位置：首页 > news >正文

12. 深入Spring AI：多模态

news 2025/11/3 6:56:01

1、什么是多模态？

通常在人工智能领域中，一种“类型数据”被简称为一种模态，如文本，图片，视频，音频等。多模态指的是同时处理、理解或生成两种及以上不同类型数据的算法或系统。

ChatGPT最开始的时候支持的单模态，仅限于文本聊天和最基本的文字对话，通常为了描述一个图片需要好几百字。而多模态的支持，我们只需要一张截图或一段公式就可以让大模型自己解析出来图片的内容。

2、Spring AI多模态的支持

Spring AI Message API 提供了支持多模态 LLM 所需的所有抽象。

在这里插入图片描述

Spring AI通过用户消息UserMessage的media字段传入我们媒体文件。UserMessage 的 content 字段主要用于文本输入，而可选的 media 字段允许添加一种或多种不同模态的额外内容，如图像、音频和视频。MimeType 指定模态类型。根据所使用的 LLM，Media 数据字段可以是原始媒体内容（作为 Resource 对象）或内容的 URI。

media 字段目前仅适用于用户输入消息（例如 UserMessage</

http://www.dtcms.com/a/560781.html

相关文章：

网站开发技术发展史网站建设要哪些人？

Argo CD vs Tekton vs Arbess，CI/CD工具一文纵评

简单创建一个flask项目

小迪安全v2023学习笔记（一百四十二讲）—— Linux系统权限提升篇VulnhubRbash绕过DockerLXD镜像History泄露

驻马店市做网站asp.net网站本机访问慢

河南网站备案所需资料厦门互联网公司排名

Vue.js 与 Ajax（axios）深度整合指南

25年05月架构甄选范文“论负载均衡设计”，软考高级，系统架构设计师论文

SQL键类型详解：超键到外键全解析

vue使用d3实现图片的缩放、拖动、添加/删除标记等功能(完整版前端+后端)

纯前端打造个人成长网站：零后端、零部署、零服务器的实践分享

Vue解决开发环境 Ajax 跨域问题

网站注册地查询济南网站建设要多少钱

清控人居建设集团网站简历模板word

RDPWD!SM_Connect函数中pRealSMHandle-＞encryptionLevel的由来

Spring数据访问基石：JDBC与事务架构总览

【Hadoop】Hadoop 起源与核心组件解析 —— 大数据时代的分布式基石

【printpdf】date.rs 文件详细解析

Pycharm详解：高效Python开发的首选IDE

广州市品牌网站建设公司微网站的特点

影刀RPA完全指南：从零开始掌握智能自动化（1/10）

淄博淘宝网站建设企业管理官网登录入口

ES6模板字符串

Dart 语法核心 7 讲：变量 + 常量 + 数据类型 + 空安全 + 运算符 + 流程控制 + 函数

【Android】活动的正/异常生命周期和启动模式、标志位详解

AI换脸技术安全指南：3条法律红线与合规实践

【2025-11-01】软件供应链安全日报：最新漏洞预警与投毒预警情报汇总

使用thefuck报错ModuleNotFoundError: No module named ‘distutils‘

算法23.0

怎么做免费的网站推广网站正在建设中 html 模板