当前位置: 首页 > news >正文

AI大模型:(二)4.2 文生图训练实践-真人写实生成

目录

1.模型选择

2.Stable Diffusion模型微调方法

3.训练工具安装

3.1.环境准备

3.2.Stable Diffusion WebUI

3.2.1.下载

3.2.2.安装

3.2.3.启动

3.3.Kohya_ss 

3.3.1.下载

3.3.2.安装

3.3.3.启动

4.数据集

4.1.准备数据集

4.2.数据集处理

4.3.数据集打标

4.3.1.安装扩展

4.3.2.图片打标

4.3.3.打标处理

5.底模型选择

1. wuhaXL_realisticMix(V3.0)

2. 林鹤-人像光影摄影极限写实真实感大模型

3. MoonMix Utopia

4. DgirlV5.1

5. LEOSAM's MoonFilm(Film Grain 2.0)

6. None-南1.5-PLUS V2

7. chilloutMix(经典模型)

8.majicMIX_realistic(麦橘写实 SD1.5)

总结推荐

6.模型训练

6.1.Textual Inversion训练(也称为 Embedding)

6.1.1.启动SD Web UI

6.1.2.创建Embedding

6.1.3.训练

6.1.4.推理生图

6.2.Hypernetwork训练

6.2.1.启动SD Web UI

6.2.2.创建Hypernetwork

6.2.3.训练

6.2.4.推理生成

6.3.Lora训练

6.3.1.启动Kohya_ss 

6.3.2.训练 

6.3.3.推理生成 

6.4.训练结果对比

7.高清生成

8.其他尺寸训练


1.模型选择

主流文生图模型对比:

模型开源/商业中文支持特色适合人群
Stable Diffusion 3开源需插件完全可控,支持视频/3D生成开发者/技术爱好者
FLUX.1[pro]商业中等专业级细节,文字生成完美广告公司/专业设计师
Seedream 3.0商业优秀</
http://www.dtcms.com/a/271698.html

相关文章:

  • 8.2 文档预处理模块(二)
  • 学习笔记(31):matplotlib绘制简单图表-直方图
  • UNet改进(19):基于残差注意力模块Residual Attention的高效分割网络设计
  • 编译安装的Mysql5.7报“Couldn‘t find MySQL server (mysqld_safe)“的原因 笔记250709
  • 主流大模型Agent框架 AutoGPT详解
  • 软件互联网产品发版检查清单
  • WIndows 编程辅助技能:格式工厂的使用
  • Dify教程更改文件上传数量限制和大小限制
  • JVM 调优
  • 双指针-15.三数之和-力扣(LeetCode)
  • AI技术如何重塑你的工作与行业?——实战案例解析与效率提升路径
  • gdb调试工具
  • Lingo软件学习(一)好学爱学
  • DPDK graph图节点处理框架:模块化数据流计算的设计与实现
  • dify配置邮箱,密码重置以及邮箱邀请加入
  • 【Java】【字节面试】字符串中 出现次数最多的字符和 对应次数
  • HTML应用指南:利用GET请求获取全国山姆门店位置信息
  • 跨服务sqlplus连接oracle数据库
  • 如何卸载本机的node.js
  • 源码角度解析 --- HashMap 的 get 和 put 流程
  • 前端使用fetch-event-source实现AI对话
  • AI Agent:我的第一个Agent项目
  • 爬虫-数据解析
  • [C语言初阶]操作符
  • ZeroMQ 代理架构实现(Python 服务端 + C++ 代理 + C++ 客户端)
  • RabbitMQ 4.1.1-Local random exchange体验
  • 解决Ollama下载太慢问题
  • Claude Code 环境搭建教程
  • Java SE--继承
  • Python 机器学习核心入门与实战进阶 Day 7 - 复盘 + 综合实战挑战