当前位置：首页 > news >正文

embbding you should know

news 2025/7/4 13:10:13

embedding：就是将词向量或者图向量采用权重升维度，更好的去表达这个特征；nn.Embedding 是 PyTorch 中的查表式嵌入层（lookup‐table），用于将离散的整数索引（如词 ID、实体 ID、离散特征类别等）映射到一个连续的、可训练的低维向量空间。它通过维护一个形状为 (num_embeddings, embedding_dim) 的权重矩阵，实现高效的“索引 → 向量”转换。为避免显式构造稀疏的 one-hot 张量，PyTorch 直接根据索引做“取行”操作，效率更高、内存更省。

import torch
import torch.nn as nn# 假设词汇表大小为10，每个词嵌入的维度为3
vocab_size = 10
embedding_dim = 256
embedding_layer = nn.Embedding(vocab_size, embedding_dim)
input_indices = torch.tensor([[1, 3, 5, 2, 7],[1, 3, 5, 2, 7]]) # [2,5]
embedded_input = embedding_layer(input_indices) #[2,5,256]

简单吧；

http://www.dtcms.com/a/265953.html

相关文章：

独立开发者软件出海：如何用Semrush高效洞察与增长

【Note】《深入理解Linux内核》Chapter 10 ：Linux 内核中的系统调用机制全解析

贝叶斯深度学习：赋予AI不确定性感知的认知革命

【Oracle学习笔记】8.函数（Function）

湖北理元理律师事务所的债务管理方法论

算法刷题打卡（1）—— 快速排序

睿尔曼系列机器人——以创新驱动未来，重塑智能协作新生态（上）

【python】OOP：Object-Oriented Programming

数字人分身+矩阵系统聚合+碰一碰发视频：源码搭建-支持OEM

AI开发平台：从技术壁垒到全民创新，AI 开发平台如何重构产业生态？

C++ 标准模板库算法之 transform 用法

STC8G 8051内核单片机开发 (中断)

在 UniApp 项目中巧用开发工具与 AI 插件：全面提升开发到部署的效率

【时间序列数据处理的噩梦与救赎：一次复杂数据可视化问题的深度复盘】

运维服务部初级服务工程师面招聘笔试题和答案

PROFINET转MODBUS TCP网关在机械臂通信操作中的应用研究

微信小程序——skyline版本问题

2025年金融创新与计算机视觉国际会议(FICV 2025)

【网络协议】WebSocket简介

Web 服务器架构选择深度解析

HTTP-Postman的安装及其使用

电脑CPU使用率占用100%怎么办解决步骤指南

【数字后端】- 衡量design的congestion情况

HTTP各版本变化详解

C# 线程同步（一）同步概念介绍

基于Anything LLM的本地知识库系统远程访问实现路径

react-打包和本地预览 ——打包优化

基于CNN的人脸关键点检测

强实时运动控制内核MotionRT750(一)：驱动安装、内核配置与使用

【科普】Cygwin与wsl与ssh连接ubuntu有什么区别？DIY机器人工房