当前位置: 首页 > wzjs >正文

wordpress整合通州优化公司

wordpress整合,通州优化公司,杭州网站设计网站,怎样做寻亲网站志愿者Classifier Free Guidance (CFG) 简介:是生成模型推理时的一种操作,目的是使的生成图像与输入的text prompt更接近。 问题:需要推理两次。 伪代码如下: 功能: 当引导系数 s0 时,等价于无引导生成当 s 增大时&#xf…

Classifier Free Guidance (CFG)

简介:是生成模型推理时的一种操作,目的是使的生成图像与输入的text prompt更接近。
问题:需要推理两次。
伪代码如下:
功能

  • 当引导系数 s=0 时,等价于无引导生成
  • 当 s 增大时,生成结果更接近提示语义,但可能降低多样性
# Class-Free Guidance(CFG)伪代码实现
def sample_with_cfg(model, x, prompt, guidance_scale, num_steps=20):"""使用无类别引导(CFG)生成图像参数:model: 扩散模型x: 初始化噪声 prompt: 文本提示guidance_scale: 引导强度系数num_steps: 扩散过程步数"""for i in range(num_steps):timestep_embed = timestep_embed_layer(i)# 第一遍推理: 无引导(无条件),预测无提示条件下的噪声noise_pred_uncond = model(x, timestep_embed, context=None)# 第二遍推理: 有引导(有条件),生成考虑提示的噪声预测noise_pred_cond = model(x, timestep_embed, context=encode_prompt(prompt))# CFG核心: 结合两次预测的结果,通过引导系数调整条件预测的影响noise_pred = noise_pred_uncond + guidance_scale * (noise_pred_cond - noise_pred_uncond)# 使用预测的噪声更新当前样本x = scheduler.step(noise_pred, i, x).prev_samplereturn decode_latents_to_image(x)  # 将最终隐变量解码为图像

CFG-Distilled

CFG-Distilled的做法就是

  • 将模型使用cfg推理的结果直接蒸馏到一个新模型上,这个新模型就不需要两次推理了。
  • 同时为了新模型也能根据不同的guidance_scale产生不同结果,将guidance_scale直接embed后输入模型中,应该是为了对模型的变动最小化,因此直接加到timestep_embed上。

FLUX.1 [dev] 用到的指引蒸馏技术似乎来自论文 On Distillation of Guided Diffusion Models。

# guidance modulation
guidance_in = TimestepEmbedder(hidden_size, get activation_layer("silu")**factory_kwargs)def cfg_distillation_training(teacher_model, student_model, dataloader, num_epochs):optimizer = AdamW(student_model.parameters(), lr=1e-5)for epoch in range(num_epochs):for batch in dataloader:images, prompts = batchx_t = add_noise(images, timestep=t) # 初始化噪声guidance_scale = random_guidance_scale(min_g, max_g)# 1. 从教师模型获取CFG目标, 教师模型执行完整CFG(两遍推理)with torch.no_grad():noise_pred_teacher_cfg = sample_with_cfg(teacher_model, x_t, prompts, guidance_scale)# 2. 学生模型单次前向传播,将guidance_scale embed到模型中timestep_embed = timestep_embed_layer(i)guaidance_embed = guidance_in(guidance_scale)noise_pred_student = model(x, timestep_embed + guaidance_embed, context=encode_prompt(prompt))# 3. 计算蒸馏损失loss = mse_loss(noise_pred_student, noise_pred_teacher_cfg)# 4. 反向传播和优化optimizer.zero_grad()loss.backward()optimizer.step()
http://www.dtcms.com/wzjs/492755.html

相关文章:

  • 小企业怎么做网站培训体系包括四大体系
  • logo商标设计网站外包服务公司
  • 网站一直不被收录网络服务
  • 国内十大网站建设公司在线域名ip查询
  • 网站平台多少钱如何进行市场推广
  • 如何给网站做防盗链长沙做引流推广的公司
  • 福州做网站公司排名网站维护中是什么意思
  • 苏州退工在哪个网站做软文代写是什么
  • 搭建企业网站steam交易链接怎么用
  • 饿了吗网站wordpress搜索热度查询
  • 杭州杭州网站建设网站建设费用
  • 党政网站建设百度seo优化软件
  • 2017年做网站好难百度经验手机版官网
  • 仿做国外产品网站出路南昌网站优化公司
  • 外语网站制作百度招聘2022年最新招聘
  • wordpress4.9升级失败南昌seo快速排名
  • 日照网站建设哪个公司好win7最好的优化软件
  • 广州做网站报价外链购买交易平台
  • 网站制作周期最近三天的国际新闻大事
  • 解决方案的网站建设百度做广告怎么收费
  • 06627网页制作和网站建设试卷重庆 seo
  • 电子商务网站建设毕业论文搜索引擎优化的技巧
  • 网站设计的总结韩国搜索引擎排名
  • 辽宁网站建设找哪家线下推广方法及策略
  • 只做网站的人员工资杭州网站制作排名
  • 武汉做网站找互赢网络手机搜索引擎排行榜
  • 湖南网站开发 岚鸿如何创建网站?
  • 呼伦贝尔市住房和城乡建设局网站域名注册局
  • 做网站需要工商证吗企业管理系统
  • 做网站硬件百度数据平台