当前位置: 首页 > wzjs >正文

国家建设网站网站制作的一般步骤

国家建设网站,网站制作的一般步骤,自建房平面图设计软件,深圳seo外包深度神经网络模型,包括 LLM,无法直接处理原始文本。由于文本是分类的,它与用于实现和训练神经网络的数学操作不兼容。因此,我们需要一种方法来将词语表示为连续值向量。 注意:如果读者对向量和张量不太了解&#xff0c…

深度神经网络模型,包括 LLM,无法直接处理原始文本。由于文本是分类的,它与用于实现和训练神经网络的数学操作不兼容。因此,我们需要一种方法来将词语表示为连续值向量。

注意:如果读者对向量和张量不太了解,请参阅《机器学习数学基础》(电子工业出版社)

将数据转换为向量格式的概念通常被称为嵌入(embedding)。通过使用特定的神经网络层或另一个预训练的神经网络模型,我们可以嵌入不同类型的数据——例如视频、音频和文本,如图 2.2 所示。然而,需要注意的是,不同的数据格式需要不同的嵌入模型。例如,为文本设计的嵌入模型不适合用于嵌入音频或视频数据。

在这里插入图片描述

图 2.2 深度学习模型无法直接处理视频、音频和文本等原始数据格式。因此,我们使用嵌入模型将这些原始数据转换成密集的向量表示,以便深度学习架构能够容易地理解并处理。具体来说,此图展示了将原始数据转换为三维数值向量的过程。

在原理上讲,嵌入是从诸如词语、图像甚至是整个文档等离散对象到连续向量空间点的映射——嵌入的主要目的是将非数值数据转换成神经网络可以处理的格式。

虽然词嵌入是最常见的文本嵌入形式,但也存在针对句子、段落或整个文档的嵌入。句子或段落嵌入是增强检索生成(retrieval-augmented generation,RAG)的通常选择。RAG 结合了生成(如产生文本)与检索(如搜索外部知识库),以在生成文本时提取相关信息。但现在,我们的目标是训练类似 GPT 的 LLM,这些模型学习一次生成一个词的文本,所以还是要专注于词嵌入。

为了生成词嵌入,已经开发了多种算法和框架。一个较早且非常流行的是 Word2Vec 方法。Word2Vec 通过给定目标词预测其上下文或者相反的方式来训练神经网络架构以生成词嵌入。Word2Vec 背后的主要思想是出现在相似上下文中的词语往往具有相似的意义。因此,当为了可视化目的被投影到二维词嵌入时,相似的术语会被聚集在一起,如图 2.3 所示。

在这里插入图片描述

图 2.3 如果词嵌入是二维的,我们可以将它们绘制在一个二维散点图中以便于可视化,如这里所示。当使用词嵌入技术(例如Word2Vec)时,表示相似概念的词语在嵌入空间中往往彼此靠近。例如,在嵌入空间中,不同类型的鸟类相互之间的距离比国家和城市的距离要近。

词嵌入可以有不同的维度,从一维到数千维不等。更高的维度可能捕捉到更细致的关系,但会牺牲计算效率。

虽然我们可以使用预训练的模型如 Word2Vec 为机器学习模型生成嵌入,但 LLM 通常会生成作为输入层一部分并在训练过程中更新的自有嵌入。将嵌入作为 LLM 训练的一部分进行优化而非使用 Word2Vec 的优势在于,这些嵌入是针对特定任务和数据进行优化的。在后续内容中将实现这样的嵌入层。

不幸的是,高维嵌入对可视化提出了挑战,因为我们的感官感知和常用的图形表示本质上被限制在三维或更低维度,这就是为什么图 2.3 展示了二维嵌入在一个二维散点图中的原因。然而,在使用 LLM 时,通常使用的嵌入具有更高的维度。对于 GPT-2 和 GPT-3 来说,嵌入大小(通常称为模型隐藏状态的维度)根据具体的模型变体和大小而变化,这是性能与效率之间的权衡。最小的 GPT-2 模型(具有1.17亿和1.25亿参数)使用 768 维度的嵌入大小以提供具体的例子。最大的 GPT-3 模型(拥有1750亿参数)则使用 12,288 维度的嵌入大小。


原文:Sebastian Raschka. Build a Large Language Model(From Scratch),此处为原文的中文翻译,为了阅读方便,有适当修改。


文章转载自:

http://nBnrGqYG.cpfbg.cn
http://vwBuY8Ti.cpfbg.cn
http://YA8BkRuK.cpfbg.cn
http://9BAS5Ucp.cpfbg.cn
http://hshxD5ee.cpfbg.cn
http://MAM4iaSE.cpfbg.cn
http://1DfuAN1E.cpfbg.cn
http://AGrt8QxH.cpfbg.cn
http://boeguTf8.cpfbg.cn
http://N1fhJpdl.cpfbg.cn
http://qEniljrq.cpfbg.cn
http://mvhudRBv.cpfbg.cn
http://qzVFjS0n.cpfbg.cn
http://bG5NkrEY.cpfbg.cn
http://sjJCZ1oU.cpfbg.cn
http://Jw43Bvb8.cpfbg.cn
http://IRsgcqEk.cpfbg.cn
http://Myigbwn7.cpfbg.cn
http://jvfD1JGd.cpfbg.cn
http://3kdGjxXV.cpfbg.cn
http://MfHV49lD.cpfbg.cn
http://T7kOeTNv.cpfbg.cn
http://i7N6ngZ3.cpfbg.cn
http://RB8bAh93.cpfbg.cn
http://BqiXAhtw.cpfbg.cn
http://J7yuzmGB.cpfbg.cn
http://IdbSsnbu.cpfbg.cn
http://jzlmrhEZ.cpfbg.cn
http://Xv5bSdZf.cpfbg.cn
http://WHsuEqwl.cpfbg.cn
http://www.dtcms.com/wzjs/643680.html

相关文章:

  • 盐城做网站企业wordpress解压主题没反应
  • 易签到网站开发设计腾冲网站建设
  • 广州市海珠区建设局网站网络公关团队
  • 西部网站邮箱登录跳转链接生成器
  • 免费网站建站排名今朝装饰老房装修套餐
  • 网站在建设中 英语淘宝cms建站
  • 哪些网站可宣传廊坊网站制作工具
  • 万网网站备案查询个人网页设计图片素材网
  • 帝国cms入门到精通企业门户网站制作建站视频教程盘县做会计兼职的网站
  • 改图宝在线编辑图片厦门seo网站
  • 天津seo网站推广古云网站建设
  • 网站建设与维护项目六 天堂资源地址在线官网
  • 手机网站发号系统源码网站建设中 倒计时
  • 竞价托管网站建设淮南网络营销
  • 什么叫网站被k软件app大全免费
  • 嘉兴网站搭建wordpress多站点功能
  • 网站设计的素材万词霸屏百度推广seo
  • 企业网站开发技术题库开发 程序网站
  • html5网站开发案例视频网站标题修改
  • 山西建设工程备案网站如何建立网站教程
  • 中关村在线网站的建设泉州电商网站建设
  • 北京市建设工程质量监督站网站保之友微网站怎么建
  • 找一个免费的网站上海网站建设电
  • 微信的公众平台网站开发南昌百度快速排名优化
  • 法人查询湖南网站优化代运营
  • 如何查看网站架构搜索引擎的优化方法
  • 网站建设整改报告购物商城项目
  • 四川自助网站小程序开发平台有哪些
  • html5高端酒水饮料企业网站模版推荐网站网页
  • 微信网站与响应式网站怎样做公司的网站