当前位置: 首页 > news >正文

【PYTORCH】官方的turoria实现中英文翻译

参考

https://pytorch.org/tutorials/intermediate/seq2seq_translation_tutorial.html

背景

pytorch官方的是seq2seq是法语到英文,做了一个中文到英文的。

数据集

下载后解压,使用的data\testsets\devset\UNv1.0.devset.zh和UNv1.0.devset.en,因为电脑配置不行,所以只选取了100行来训练。

https://www.un.org/dgacm/sites/www.un.org.dgacm/files/files/UNCORPUS/UNv1.0.testsets.tar.gz

具体代码

行数太多,放在了gitee上。

https://gitee.com/likexiang/source-code-records/blob/master/pythonTranslationZHToEn.py

问题

会出现部分这种解析出来是0的,但是又翻译对了,不知道是怎么回事?

> 澳大利亚(2017)、加拿大(2016)、丹麦(2017)、德国(2016)、意大利* (2015)、美利坚合众国* (2015)
= Australia (2017), Canada (2016), Denmark (2017), Germany (2016), Italy* (2015), United States of America* (2015)
input_tensor is tensor([[259, 260, 261, 208, 262,  19, 263, 260, 264, 208, 262,  19, 265, 260,
         261, 208, 262,  19, 266, 260, 264, 208, 262,  19, 267, 268,  49, 260,
         269, 208, 262,  19, 270, 268,  49, 260, 269, 208, 262,   1]])
decoded_ids is tensor([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0])
< SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS
http://www.dtcms.com/a/21319.html

相关文章:

  • 水务+AI应用探索(一)| FastGPT+DeepSeek 本地部署
  • 团体程序设计天梯赛-练习集——L1-041 寻找250
  • nlf 3d pose 部署学习笔记
  • (尚硅谷 Java 学习 B 站大学版)Day17 多态练习
  • 目标检测IoU阈值全解析:YOLO/DETR模型中的精度-召回率博弈与工程实践指南
  • String、StringBuffer、StringBuilder 区别
  • Spring Boot 如何实现自动配置?
  • 箭头函数的this指向谁
  • trl + 大模型reward训练
  • 【大模型】DeepSeek使用与原理解析:从V3到R1
  • 424个蒙太奇电影风格空气 、火焰 、飞越、运动、岩石、车、水通用嗖嗖声音效库
  • Python----Python高级(网络编程:网络高级:多播和广播,C/S架构,TCP,UDP,网络编程)
  • 蓝桥与力扣刷题(230 二叉搜索树中第k小的元素)
  • Java项目《苍穹外卖》BUG修复记录
  • 微分方程(Blanchard Differential Equations 4th)-补充习题03
  • windows11 wsl报错
  • 总部年会天府感怀
  • 动态规划 之 数组长度加长规避初始化
  • internVL的本地部署微调实践——L2G4
  • 标准输入输出流,面向对象,构造函数
  • Kafka集群,常见MQ面试问题
  • 聚簇索引和非聚簇索引
  • 蓝桥杯 Java B 组之栈的应用(括号匹配、表达式求值)
  • Python 2 和 Python 3 在字符串编码上的差异
  • java八股文之Redis
  • 政务浏览器API文档及Demo大升级
  • uniapp二次封装组件(py组件)
  • SQL复习
  • 微调codegeex
  • 跟着AI学习vue3第二章