当前位置：首页 > news >正文

AI大模型：（二）4.2 文生图训练实践-真人写实生成

news 2025/11/11 14:03:33

目录

1.模型选择

2.Stable Diffusion模型微调方法

3.训练工具安装

3.1.环境准备

3.2.Stable Diffusion WebUI

3.2.1.下载

3.2.2.安装

3.2.3.启动

3.3.Kohya_ss

3.3.1.下载

3.3.2.安装

3.3.3.启动

4.数据集

4.1.准备数据集

4.2.数据集处理

4.3.数据集打标

4.3.1.安装扩展

4.3.2.图片打标

4.3.3.打标处理

5.底模型选择

1. wuhaXL_realisticMix（V3.0）

2. 林鹤-人像光影摄影极限写实真实感大模型

3. MoonMix Utopia

4. DgirlV5.1

5. LEOSAM's MoonFilm（Film Grain 2.0）

6. None-南1.5-PLUS V2

7. chilloutMix（经典模型）

8.majicMIX_realistic（麦橘写实 SD1.5）

总结推荐

6.模型训练

6.1.Textual Inversion训练(也称为 Embedding)

6.1.1.启动SD Web UI

6.1.2.创建Embedding

6.1.3.训练

6.1.4.推理生图

6.2.Hypernetwork训练

6.2.1.启动SD Web UI

6.2.2.创建Hypernetwork

6.2.3.训练

6.2.4.推理生成

6.3.Lora训练

6.3.1.启动Kohya_ss

6.3.2.训练

6.3.3.推理生成

6.4.训练结果对比

7.高清生成

8.其他尺寸训练

1.模型选择

主流文生图模型对比：

模型	开源/商业	中文支持	特色	适合人群
Stable Diffusion 3	开源	需插件	完全可控，支持视频/3D生成	开发者/技术爱好者
FLUX.1[pro]	商业	中等	专业级细节，文字生成完美	广告公司/专业设计师
Seedream 3.0	商业	优秀</

http://www.dtcms.com/a/271698.html

相关文章：

8.2 文档预处理模块（二）

学习笔记(31):matplotlib绘制简单图表-直方图

UNet改进（19）：基于残差注意力模块Residual Attention的高效分割网络设计

编译安装的Mysql5.7报“Couldn‘t find MySQL server (mysqld_safe)“的原因笔记250709

主流大模型Agent框架 AutoGPT详解

软件互联网产品发版检查清单

WIndows 编程辅助技能：格式工厂的使用

Dify教程更改文件上传数量限制和大小限制

JVM 调优

双指针-15.三数之和-力扣(LeetCode)

AI技术如何重塑你的工作与行业？——实战案例解析与效率提升路径

gdb调试工具

Lingo软件学习（一）好学爱学

DPDK graph图节点处理框架：模块化数据流计算的设计与实现

dify配置邮箱，密码重置以及邮箱邀请加入

【Java】【字节面试】字符串中出现次数最多的字符和对应次数

HTML应用指南：利用GET请求获取全国山姆门店位置信息

跨服务sqlplus连接oracle数据库

如何卸载本机的node.js

源码角度解析 --- HashMap 的 get 和 put 流程

前端使用fetch-event-source实现AI对话

AI Agent：我的第一个Agent项目

爬虫-数据解析

[C语言初阶]操作符

ZeroMQ 代理架构实现（Python 服务端 + C++ 代理 + C++ 客户端）

RabbitMQ 4.1.1-Local random exchange体验

解决Ollama下载太慢问题

Claude Code 环境搭建教程

Java SE--继承

Python 机器学习核心入门与实战进阶 Day 7 - 复盘 + 综合实战挑战