当前位置：首页 > wzjs >正文

做网站选哪家公司南宁房地产最新消息

wzjs 2025/9/14 23:53:02

做网站选哪家公司,南宁房地产最新消息,开发一个app大概需要多少钱?,青浦华新网站建设详细描述一下stable Diffusion的推理过程其实很简单 prompt先经过textencoder tokenizer，embedding 随机生成噪声图片通过vae encode压缩成潜空间大小 unet with cross attn 去噪并融合文本信息 # 上面两个信息如何混合 cross-attention sd模型中各种不同的采样器…

详细描述一下stable Diffusion的推理过程

其实很简单

prompt先经过textencoder tokenizer，embedding

随机生成噪声图片通过vae encode压缩成潜空间大小

unet with cross attn 去噪并融合文本信息

# 上面两个信息如何混合

cross-attention

sd模型中各种不同的采样器作用在哪个步骤

# 1. 预测当前时间步 t 的噪声

noise_pred = unet(latents, t, encoder_hidden_states=text_embeddings).sample

# 2. 通过调度器 scheduler 从 z_t 计算出 z_{t-1}

latents = scheduler.step(noise_pred, t, latents).prev_sample

这里noise_pred已经预测出来了为什么还要通过scheduler.step

采样器原来是我一直以来说的减去的操作，就是噪声已经生成出来了其实

因为噪声不是直接加的，还加了系数/权重

像E一样的那个字母表示噪声

noise_pred已经是噪声了，直接用噪声图片减去这个noise_pred，不就得到最终的图片了吗为什么还要scheduler.step

ddpm

重点---加噪过程

import torch

import torch.nn as nn

import torch.nn.functional as F

from transformers import CLIPProcessor, CLIPModel

from torchvision import transforms

from PIL import Image

import numpy as np

# 1. 文本编码器：CLIP 模型

class TextEncoder(nn.Module):

def __init__(self):

super().__init__()

# 使用 CLIP 模型来处理文本

self.clip_model = CLIPModel.from_pretrained("openai/clip-vit-base-patch32")

self.processor = CLIPProcessor.from_pretrained("openai/clip-vit-base-patch32")

def forward(self, text):

# 将文本转换为潜在向量

inputs = self.processor(text=text, return_tensors="pt", padding=True)

text_features = self.clip_model.get_text_features(**inputs)

return text_features

# 2. U-Net 网络定义（简化版）

class UNet(nn.Module):

def __init__(self, in_channels, out_channels, channels=64):

super().__init__()

self.conv1 = nn.Conv2d(in_channels, channels, kernel_size=3, padding=1)

self.conv2 = nn.Conv2d(channels, channels, kernel_size=3, padding=1)

self.conv3 = nn.Conv2d(channels, out_channels, kernel_size=3, padding=1)

def forward(self, x):

x = F.relu(self.conv1(x))

x = F.relu(self.conv2(x))

x = self.conv3(x)

return x

# 3. 反向去噪过程 (简化版)

class DiffusionModel(nn.Module):

def __init__(self, text_encoder, unet, image_size=64):

super().__init__()

self.text_encoder = text_encoder

self.unet = unet

self.image_size = image_size

def forward(self, text, noise=None):

# 1. 获取文本的潜在向量

text_features = self.text_encoder(text)

# 2. 初始化噪声图像 (如果没有提供的话)

if noise is None:

noise = torch.randn(1, 3, self.image_size, self.image_size)

# 3. 将噪声图像和文本特征一起输入 U-Net

noise = self.unet(noise)

# 4. 返回生成的图像

return noise

# 4. 图像解码器（简化版）

def decode_latent_to_image(latent_tensor):

# 这里简单地将潜在图像的输出处理为一个可视化的图像

img = latent_tensor.squeeze(0).detach().cpu().numpy().transpose(1, 2, 0)

img = (img * 255).clip(0, 255).astype(np.uint8)

img = Image.fromarray(img)

return img

# 5. 生成过程

def generate_image(prompt, image_size=64):

# 初始化文本编码器和 U-Net

text_encoder = TextEncoder()

unet = UNet(3, 3)

# 初始化 Diffusion 模型

model = DiffusionModel(text_encoder, unet, image_size)

# 推理过程

generated_image = model(prompt)

# 解码生成的图像

img = decode_latent_to_image(generated_image)

return img

# 6. 测试生成

prompt = ["A futuristic city skyline at night"]

generated_img = generate_image(prompt)

# 显示生成的图像

generated_img.show()

文章转载自：

http://RwGK818S.pqmjs.cn
http://PWVSbH2t.pqmjs.cn
http://r4Ai1mTr.pqmjs.cn
http://NUNOS06K.pqmjs.cn
http://d4gC5YUn.pqmjs.cn
http://o0102SG0.pqmjs.cn
http://DQ9ehulz.pqmjs.cn
http://CC1nASbK.pqmjs.cn
http://asMPa0e4.pqmjs.cn
http://MKcf5j0u.pqmjs.cn
http://f7NidYCL.pqmjs.cn
http://Gv2jXjU0.pqmjs.cn
http://7qxIPByy.pqmjs.cn
http://uTv4nfw5.pqmjs.cn
http://up9vV5GF.pqmjs.cn
http://Iv212SFc.pqmjs.cn
http://QDMf2hTy.pqmjs.cn
http://rq3LiIBb.pqmjs.cn
http://NuziJJIl.pqmjs.cn
http://jPMo3qIH.pqmjs.cn
http://5xVT0uGh.pqmjs.cn
http://Io4JBGQh.pqmjs.cn
http://nnRhKFXy.pqmjs.cn
http://p0MA6P8z.pqmjs.cn
http://WI21hi3D.pqmjs.cn
http://EVsXl4oX.pqmjs.cn
http://VVPyuvoH.pqmjs.cn
http://NsD195Jb.pqmjs.cn
http://djBnYvOS.pqmjs.cn
http://mHJpLucZ.pqmjs.cn

查看全文

http://www.dtcms.com/wzjs/735677.html

包装材料东莞网站建设网站开发框架有哪些

做网站江西大连企业做网站公司排名

做剧情游戏的网站邢台市政建设集团网站

.net asp可以外链其它网站吗北京房产交易网官网

微信运营工具如何做seo网站

大连电子学校网站建设哪个网站做外链视频好

清远做网站哪家好做安全防护信息的网站

工程行业网站h5小游戏在线玩

博客网站开发源代码优化方案英语答案

千套模板快速自助建站消防工程师证怎么考

苏州哪家做网站好wordpress相册效果

如何做导购网站自己做的网站如何引流

用html做网站源代码流量套餐汇总网站

苏州建设工程质量监督站网站网站前置或专项审批

趴比库的网站是谁建设的泰安高品质网站建设

安平县护栏网站建设网站建设三秒原则

网站平台建设费用的会计核算高水平的网站建设公司

吉粤建设工程股份有限公司网站安阳建设局网站

想让一个网站上线需要怎么做雅思培训班价格一览表

网站页面布局模板wordPress如何设置

可以做高清思维导图的网站深圳网站建设的特殊性

上海网站建设上海网站制作双城网站

网站建设与维护成绩查询个人信息服务平台登录

ps做汽车网站下载aso排名优化知识

做餐饮如何加入外卖网站网页制作与网站建设试卷及答案

域名建设好了怎么在建设网站企业网站的建立视频

长春网站建设wordpress最强的教育网站

双峰网站建设网站手机端跳转页面模板

网站建设微信软文c2c网站开发毕业设计

学校网站建设需求分析调研表网站名称规则

相关文章：