当前位置: 首页 > news >正文

【LangChain4J】LangChain4J 第三弹:多模态与文生图的实现

目录

一、文生图

1.1 基于通义万相实现文生图

1.2 基于智普实现文生图

二、多模态

2.1 使用场景

2.2 技术实现

2.3 多模态的实现(读取网络图片)

2.4 实现多模态(读取本地文件)


一、文生图

文生图 是多模态任务的一种具体形式,指通过文本描述生成对应图像的技术。其核心目标是将人类语言的抽象语义转化为视觉具象,广泛应用于创意设计、游戏开发、虚拟内容生成等领域。

1.1 基于通义万相实现文生图

1. 配置通义万相

@Configuration
public class ImageModelConfig {@Beanpublic ImageModel wanxImageModel() {return WanxImageModel.builder()// 生产级别配置到 Nacos.apiKey(System.getenv("ALIYUN-AK")).modelName("wanx2.1-t2i-plus").build();}
}

提供的模型列表如下:

  • wanx2.1-t2i-plus:生成图像细节更丰富,速度较慢。对应通义万相官网 2.1 专业模型。生成费用 0.20元/张。

  • wanx2.1-t2i-turbo:生成速度快、效果全面、性价比高。对应通义万相官网2.1极速模型。生成费用 0.14元/张。

  • wanx2.0-t2i-turbo:擅长质感人像,速度中等、成本较低。对应通义万相官网 2.0 极速模型。生成费用 0.04元/张。

2. 编写调用代码

import dev.langchain4j.model.image.ImageModel;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.bind.annotation.RestController;@RestController
@RequestMapping("/img")
public class ImageController {@Autowiredprivate ImageModel wanxImageModel;@RequestMapping("/gen")public String gen(@RequestParam("msg") String msg) {String url = wanxImageModel.generate(msg).content().url().toString();System.out.println(url);return url;}
}

相关文章:

  • 删除有序数组中的重复项
  • CZGL.SystemInfo:跨平台的系统信息获取库
  • Deep Research实践
  • 程序代码篇---随机数与随机数种子
  • 【Java学习笔记】Arrays类
  • C++17 和 C++20 中的新容器与工具:std::optional、std::variant 和 std::span
  • 大语言模型(LLM)面试问题集
  • 实验一:数据选择器实验
  • C++核心编程_继承同名静态成员处理方式
  • 深入理解链接与加载:从静态库到动态库的全流程解析
  • 【第八篇】 SpringBoot高级配置(配置篇)
  • 【SpringBoot自动化部署方法】
  • 图像超分辨率
  • 深度学习模块缝合
  • 线程与线程池
  • Pandas-如何正确将两张数据表进行合并
  • 碳排放智能分析与优化系统:工业减排的革命性突破
  • 高保真组件库:下拉框
  • 面试实例题
  • 【P2P】低延迟直播(尤其是 P2P 实时分发)常用的 x264 编码参数示例
  • 自助做网站/推广普通话的意义论文
  • 进一步推进网站集约化建设/常用seo站长工具
  • 不同企业的网络营销网站/淘宝直通车推广怎么做
  • 成都网站建设网/长春建站程序
  • iis做网站的流程/百度网盟推广
  • 网站首页图片大小/网站创建的流程是什么