当前位置：首页 > news >正文

NNLM神经网络语言模型总结

news 2025/11/1 2:51:42

一开始还以为很复杂，总结一下就是：

NNLM 将某个单词前 n−1 个词各自转为 embedding，拼接成一个 (n−1)⋅d 维的向量，再通过隐藏层 + 输出层 + softmax，预测下一个词的概率分布

可以发现，这个2003年提出的模型在架构上和GPT大体是没区别的，都是用之前的文字预测下一个文字；都是用之前文字的embedding经过一个特殊层（前者是FFN，后者是transformer decoder）来得到一个词表向量，根据向量的分量大小选择某个单词。

后话

当然，前者的效果差多啦，也存在不能辨别n-1个token顺序等问题。但是，还是感觉挺神奇的。

http://www.dtcms.com/a/189534.html

相关文章：

使用 hover-class 实现触摸态效果 - uni-app 教程

使用VSCode编辑Markdown+PlantUml

推荐一个Winform开源的UI工具包

HTTP / HTTPS 协议

移动网页调试工具实战：从 Chrome 到 WebDebugX 的效率演进

【C/C++】自定义类型：结构体

Ubuntu 系统默认已安装 python，此处只需添加一个超链接即可

单向循环链表C语言实现实现(全)

在Ubuntu24.04中配置开源直线特征提取软件DeepLSD

Kubernetes排错(十七) ：kubelet日志报device or resource busy

IIS服务器URL重写配置完整教程

Spark 集群配置、启动与监控指南

榕壹云打车系统：基于Spring Boot+MySQL+UniApp的开源网约车解决方案

DAX权威指南2：CALCULATE 与 CALCULATETABLE

【Linux笔记】——进程信号的捕捉——从中断聊聊OS是怎么“活起来”的

Jmeter变量传递介绍

【Java面试题】——this 和 super 的区别

Jmeter对服务端进行压测快速上手

使用IDEA创建Maven版本的web项目以及lombok的使用

PyTorch 中神经网络相关要点（损失函数，学习率）及优化方法总结

Jmeter -- JDBC驱动连接数据库超详细指南

VS打印printf、cout或者Qt的qDebug等传出的打印信息

微服务调试问题总结

OpenHarmony 开源鸿蒙南向开发——linux下使用make交叉编译第三方库——wget

SPL做量化--DMA（平均差分析指标）

嵌入式Linux Qt开发：2、Qt creator简单配置、Qt Designer使用以及信号槽机制使用

进阶数据结构： AVL树

LeetCode 热题 100 114. 二叉树展开为链表

【C++】map和set的模拟实现

PyTorch深度神经网络（前馈、卷积神经网络）