当前位置: 首页 > wzjs >正文

做网站选哪家公司南宁房地产最新消息

做网站选哪家公司,南宁房地产最新消息,开发一个app大概需要多少钱?,青浦华新网站建设详细描述一下stable Diffusion的推理过程 其实很简单 prompt先经过textencoder tokenizer,embedding 随机生成噪声图片 通过vae encode压缩成潜空间大小 unet with cross attn 去噪 并融合文本信息 # 上面两个信息如何混合 cross-attention sd模型中各种不同的采样器…

详细描述一下stable Diffusion的推理过程

其实很简单

prompt先经过textencoder tokenizer,embedding

随机生成噪声图片 通过vae encode压缩成潜空间大小

unet with cross attn 去噪 并融合文本信息

# 上面两个信息如何混合

cross-attention

sd模型中各种不同的采样器作用在哪个步骤

# 1. 预测当前时间步 t 的噪声

noise_pred = unet(latents, t, encoder_hidden_states=text_embeddings).sample

# 2. 通过调度器 scheduler 从 z_t 计算出 z_{t-1}

latents = scheduler.step(noise_pred, t, latents).prev_sample

这里noise_pred已经预测出来了 为什么还要通过scheduler.step

采样器原来是我一直以来说的减去的操作,就是噪声已经生成出来了其实

因为噪声不是直接加的,还加了系数/权重

像E一样的那个字母表示噪声

 

 

 

 

noise_pred已经是噪声了,直接用噪声图片减去这个noise_pred,不就得到最终的图片了吗 为什么还要scheduler.step

ddpm

重点---加噪过程

import torch

import torch.nn as nn

import torch.nn.functional as F

from transformers import CLIPProcessor, CLIPModel

from torchvision import transforms

from PIL import Image

import numpy as np

# 1. 文本编码器:CLIP 模型

class TextEncoder(nn.Module):

    def __init__(self):

        super().__init__()

        # 使用 CLIP 模型来处理文本

        self.clip_model = CLIPModel.from_pretrained("openai/clip-vit-base-patch32")

        self.processor = CLIPProcessor.from_pretrained("openai/clip-vit-base-patch32")

    def forward(self, text):

        # 将文本转换为潜在向量

        inputs = self.processor(text=text, return_tensors="pt", padding=True)

        text_features = self.clip_model.get_text_features(**inputs)

        return text_features

# 2. U-Net 网络定义(简化版)

class UNet(nn.Module):

    def __init__(self, in_channels, out_channels, channels=64):

        super().__init__()

        self.conv1 = nn.Conv2d(in_channels, channels, kernel_size=3, padding=1)

        self.conv2 = nn.Conv2d(channels, channels, kernel_size=3, padding=1)

        self.conv3 = nn.Conv2d(channels, out_channels, kernel_size=3, padding=1)

    def forward(self, x):

        x = F.relu(self.conv1(x))

        x = F.relu(self.conv2(x))

        x = self.conv3(x)

        return x

# 3. 反向去噪过程 (简化版)

class DiffusionModel(nn.Module):

    def __init__(self, text_encoder, unet, image_size=64):

        super().__init__()

        self.text_encoder = text_encoder

        self.unet = unet

        self.image_size = image_size

    def forward(self, text, noise=None):

        # 1. 获取文本的潜在向量

        text_features = self.text_encoder(text)

       

        # 2. 初始化噪声图像 (如果没有提供的话)

        if noise is None:

            noise = torch.randn(1, 3, self.image_size, self.image_size)

        # 3. 将噪声图像和文本特征一起输入 U-Net

        noise = self.unet(noise)

       

        # 4. 返回生成的图像

        return noise

# 4. 图像解码器(简化版)

def decode_latent_to_image(latent_tensor):

    # 这里简单地将潜在图像的输出处理为一个可视化的图像

    img = latent_tensor.squeeze(0).detach().cpu().numpy().transpose(1, 2, 0)

    img = (img * 255).clip(0, 255).astype(np.uint8)

    img = Image.fromarray(img)

    return img

# 5. 生成过程

def generate_image(prompt, image_size=64):

    # 初始化文本编码器和 U-Net

    text_encoder = TextEncoder()

    unet = UNet(3, 3)

    # 初始化 Diffusion 模型

    model = DiffusionModel(text_encoder, unet, image_size)

    # 推理过程

    generated_image = model(prompt)

    # 解码生成的图像

    img = decode_latent_to_image(generated_image)

    return img

# 6. 测试生成

prompt = ["A futuristic city skyline at night"]

generated_img = generate_image(prompt)

# 显示生成的图像

generated_img.show()


文章转载自:

http://RwGK818S.pqmjs.cn
http://PWVSbH2t.pqmjs.cn
http://r4Ai1mTr.pqmjs.cn
http://NUNOS06K.pqmjs.cn
http://d4gC5YUn.pqmjs.cn
http://o0102SG0.pqmjs.cn
http://DQ9ehulz.pqmjs.cn
http://CC1nASbK.pqmjs.cn
http://asMPa0e4.pqmjs.cn
http://MKcf5j0u.pqmjs.cn
http://f7NidYCL.pqmjs.cn
http://Gv2jXjU0.pqmjs.cn
http://7qxIPByy.pqmjs.cn
http://uTv4nfw5.pqmjs.cn
http://up9vV5GF.pqmjs.cn
http://Iv212SFc.pqmjs.cn
http://QDMf2hTy.pqmjs.cn
http://rq3LiIBb.pqmjs.cn
http://NuziJJIl.pqmjs.cn
http://jPMo3qIH.pqmjs.cn
http://5xVT0uGh.pqmjs.cn
http://Io4JBGQh.pqmjs.cn
http://nnRhKFXy.pqmjs.cn
http://p0MA6P8z.pqmjs.cn
http://WI21hi3D.pqmjs.cn
http://EVsXl4oX.pqmjs.cn
http://VVPyuvoH.pqmjs.cn
http://NsD195Jb.pqmjs.cn
http://djBnYvOS.pqmjs.cn
http://mHJpLucZ.pqmjs.cn
http://www.dtcms.com/wzjs/735677.html

相关文章:

  • 包装材料东莞网站建设网站开发框架有哪些
  • 做网站江西大连企业做网站公司排名
  • 做剧情游戏的网站邢台市政建设集团网站
  • .net asp可以外链其它网站吗北京房产交易网官网
  • 微信运营工具如何做seo网站
  • 大连电子学校网站建设哪个网站做外链视频好
  • 清远做网站哪家好做安全防护信息的网站
  • 工程行业网站h5小游戏在线玩
  • 博客网站开发源代码优化方案英语答案
  • 千套模板快速自助建站消防工程师证怎么考
  • 苏州哪家做网站好wordpress相册效果
  • 如何做导购网站自己做的网站如何引流
  • 用html做网站源代码流量套餐汇总网站
  • 苏州建设工程质量监督站网站网站前置或专项审批
  • 趴比库的网站是谁建设的泰安高品质网站建设
  • 安平县护栏网站建设网站建设三秒原则
  • 网站平台建设费用的会计核算高水平的网站建设公司
  • 吉粤建设工程股份有限公司网站安阳建设局网站
  • 想让一个网站上线需要怎么做雅思培训班价格一览表
  • 网站页面布局模板wordPress如何设置
  • 可以做高清思维导图的网站深圳网站建设的特殊性
  • 上海网站建设上海网站制作双城网站
  • 网站建设与维护成绩查询个人信息服务平台登录
  • ps做汽车网站下载aso排名优化知识
  • 做餐饮如何加入外卖网站网页制作与网站建设试卷及答案
  • 域名建设好了怎么在建设网站企业网站的建立视频
  • 长春网站建设wordpress最强的教育网站
  • 双峰网站建设网站手机端跳转页面模板
  • 网站建设微信软文c2c网站开发毕业设计
  • 学校网站建设需求分析调研表网站名称 规则