当前位置: 首页 > wzjs >正文

网站里的动画效果图360免费建站搜索引擎收录吗

网站里的动画效果图,360免费建站搜索引擎收录吗,个人定做衣服店,宁波外贸推广网络营销从零开始的NLP:使用序列到序列网络和注意力机制进行翻译 我们将编写自己的类和函数来预处理数据以完成我们的 NLP 建模任务。 在这个项目中,我们将训练一个神经网络将法语翻译成英语。 [KEY: > input, = target, < output]> il est en train de peindre un table…

从零开始的NLP:使用序列到序列网络和注意力机制进行翻译

我们将编写自己的类和函数来预处理数据以完成我们的 NLP 建模任务。

在这个项目中,我们将训练一个神经网络将法语翻译成英语。

[KEY: > input, = target, < output]> il est en train de peindre un tableau .
= he is painting a picture .
< he is painting a picture .> pourquoi ne pas essayer ce vin delicieux ?
= why not try that delicious wine ?
< why not try that delicious wine ?> elle n est pas poete mais romanciere .
= she is not a poet but a novelist .
< she not not a poet but a novelist .> vous etes trop maigre .
= you re too skinny .
< you re all alone .

… 取得不同程度的成功。

这得益于简单而强大的序列到序列网络思想,其中两个循环神经网络协同工作以将一个序列转换为另一个序列。编码器网络将输入序列压缩成一个向量,解码器网络将该向量展开成一个新的序列。

在这里插入图片描述

为了改进这个模型,我们将使用一个注意力机制,它允许解码器学习集中关注输入序列的特定范围。

你还会发现之前的从零开始的 NLP:使用字符级 RNN 分类名称 和 从零开始的 NLP:使用字符级 RNN 生成名称 教程非常有用,因为这些概念分别与编码器和解码器模型非常相似。

要求

from __future__ import unicode_literals, print_function, division
from io import open
import unicodedata
import re
import randomimport torch
import torch.nn as nn
from torch import optim
import torch.nn.functional as Fimport numpy as np
from torch.utils.data import TensorDataset, DataLoader, RandomSamplerdevice = torch.device("cuda" if torch.cuda.is_available() else "cpu")

加载数据文件

本项目的数据集包含数千对英法翻译对。

Open Data Stack Exchange 上的这个问题 指引我找到了开放翻译网站 https://tatoeba.org/,该网站在 https://tatoeba.org/eng/downloads 提供下载——更妙的是,有人做了额外的工作,将语言对分成独立的文本文件,在此处提供:https://www.manythings.org/anki/

英法翻译对文件太大,无法包含在仓库中,请在继续之前下载到 data/eng-fra.txt。该文件是以制表符分隔的翻译对列表

I am cold.    J'ai froid.

注意

从这里下载数据并将其解压到当前目录。

与字符级 RNN 教程中使用的字符编码类似,我们将语言中的每个词表示为一个独热向量,或者一个巨大的零向量,除了一个位置为一(该词的索引)。与语言中可能存在的几十个字符相比,词的数量要多得多,因此编码向量更大。然而,我们将稍微做一些妥协,仅使用每种语言的几千个词来修剪数据。

在这里插入图片描述

我们稍后需要为每个词设置一个唯一的索引,用作网络的输入和目标。为了跟踪所有这些,我们将使用一个名为 Lang 的辅助类,它包含 word → index (word2index) 和 index → word (index2word) 字典,以及每个词的计数 word2count,这将用于稍后替换罕见词。

SOS_token = 0
EOS_token = 1class Lang:def __init__(self, name):self.name = nameself.word2index = {}self.word2count = {}self.index2word = {0: "SOS", 1: "EOS"}self.n_words = 2  # Count SOS and EOSdef addSentence(self, sentence):for word in sentence.split(' '):self.addWord(word)def addWord(self, word):if word not in self.word2index:self.word2index[word] = self.n_wordsself.word2count[word] = 1self.index2word[self.n_words] = wordself.n_words += 1else:self.word2count[word] += 1

所有文件都是 Unicode 格式,为了简化,我们将 Unicode 字符转换为 ASCII,全部转换为小写,并去除大部分标点符号。

# Turn a Unicode string to plain ASCII, thanks to
# https://stackoverflow.com/a/518232/2809427
def unicodeToAscii(s):return ''.join(c for c in unicodedata.normalize('NFD', s)if unicodedata.category(c) != 'Mn')# Lowercase, trim, and remove non-letter characters
def normalizeString(s):s = unicodeToAscii(s.lower().strip())s = re.sub(r"([.!?])", r" \1", s)s = re.sub(r"[^a-zA-Z!?]+", r" ", s)return s.strip()

为了读取数据文件,我们将文件按行分割,然后将行分割成对。文件都是英语 → 其他语言,因此如果我们要从其他语言 → 英语翻译,我添加了 reverse 标志来反转翻译对。

def readLangs(lang1, lang2, reverse=False):print("Reading lines...")# Read the file and split into lineslines = open('data/%s-%s.txt' % (lang1, lang2), encoding='utf-8').\read().strip().split('\n')# Split every line into pairs and normalizepairs = [[normalizeString(s) for s in l.split('\t')] for l in lines]# Reverse pairs, make Lang instancesif reverse:pairs = [list(reversed(p)) for p in pairs]input_lang = Lang(lang2)output_lang = Lang(lang1)else:input_lang = Lang(lang1)output_lang = Lang(lang2)re

文章转载自:

http://Sp7Da5jl.gtnyq.cn
http://Y4K84ktV.gtnyq.cn
http://DAnEGwU8.gtnyq.cn
http://UJhURnds.gtnyq.cn
http://pak0MjXl.gtnyq.cn
http://DkYkYyFZ.gtnyq.cn
http://xppRiDMv.gtnyq.cn
http://7vaUbQe1.gtnyq.cn
http://JCcWsXA9.gtnyq.cn
http://Ojgrbslg.gtnyq.cn
http://xA5gvUzk.gtnyq.cn
http://U9C1WbRa.gtnyq.cn
http://S5nDEUh4.gtnyq.cn
http://AnCu2dgW.gtnyq.cn
http://LefgZuOA.gtnyq.cn
http://1D3xlejz.gtnyq.cn
http://vzzRRisP.gtnyq.cn
http://1a7GBWfq.gtnyq.cn
http://XRopbWXT.gtnyq.cn
http://a2syvowZ.gtnyq.cn
http://QjXEcMAe.gtnyq.cn
http://Myri768s.gtnyq.cn
http://yqSnaY0O.gtnyq.cn
http://pQYm3QuU.gtnyq.cn
http://uBjRn0py.gtnyq.cn
http://y5ntYQ0h.gtnyq.cn
http://sfW0yJvy.gtnyq.cn
http://ydZ5Dv2e.gtnyq.cn
http://GfBod9Ro.gtnyq.cn
http://wS7VNaH6.gtnyq.cn
http://www.dtcms.com/wzjs/715677.html

相关文章:

  • asp.net网站建设ppt网站后台修改图片集顺序
  • 网站备案取消接入企业网站制作设计公司
  • 烟台网站建设外贸wordpress分类编辑器
  • 建设银行网站账户注销私密浏览器官网
  • 广西网站设计服务腾讯企业邮箱官网登录入口网页版
  • 分类网站开发ios6软件下载网站
  • 建设部职称证书查询官方网站怎样设计静态网站页面
  • 最优的手机网站建设云南网站的设计公司
  • 网站建设 技术支持 阿里搜狗seo快速排名公司
  • 临清网站建设网站制作过程中碰到的问题
  • 网站建设步骤详解网站建设软件开发公司
  • 用rp怎么做网站功能按钮阿里云网站建设教程视频
  • 四川住房建设部网站利用网站做淘宝客
  • 学习网站开发流程wordpress仿站实战
  • 购买网站建站wordpress 增加 导航栏
  • 网站公司名称大全天使投资平台官网
  • 公司手机网站模板学做古典家具网站
  • 云主机搭建网站网站制作问题 图片版权
  • 成都自助建站软件长春网络优化最好的公司
  • 佛山网站建设永网上海平台公司
  • 通信工程企业网站建设杭州网站建设哪个好
  • 永久免费wap建站百度热议怎么上首页
  • 上海沙龙网站建设wordpress自定义帖子链接
  • 如何建设一个国外网站韩语网站建设
  • 百度联盟怎么做自己的网站织梦网站英文版怎么做
  • 给别人做非法网站能判多久网站建设博敏
  • 可以自己做歌曲的网站为什么网站 关键词策划
  • 唐山企业网站建设美食类网站开发说明书
  • 网站的步骤做网页需要什么
  • 十大免费建站程序wordpress李家沱网站建设