当前位置: 首页 > news >正文

【PYTORCH】官方的turoria实现中英文翻译

参考

https://pytorch.org/tutorials/intermediate/seq2seq_translation_tutorial.html

背景

pytorch官方的是seq2seq是法语到英文,做了一个中文到英文的。

数据集

下载后解压,使用的data\testsets\devset\UNv1.0.devset.zh和UNv1.0.devset.en,因为电脑配置不行,所以只选取了100行来训练。

https://www.un.org/dgacm/sites/www.un.org.dgacm/files/files/UNCORPUS/UNv1.0.testsets.tar.gz

具体代码

行数太多,放在了gitee上。

https://gitee.com/likexiang/source-code-records/blob/master/pythonTranslationZHToEn.py

问题

会出现部分这种解析出来是0的,但是又翻译对了,不知道是怎么回事?

> 澳大利亚(2017)、加拿大(2016)、丹麦(2017)、德国(2016)、意大利* (2015)、美利坚合众国* (2015)
= Australia (2017), Canada (2016), Denmark (2017), Germany (2016), Italy* (2015), United States of America* (2015)
input_tensor is tensor([[259, 260, 261, 208, 262,  19, 263, 260, 264, 208, 262,  19, 265, 260,
         261, 208, 262,  19, 266, 260, 264, 208, 262,  19, 267, 268,  49, 260,
         269, 208, 262,  19, 270, 268,  49, 260, 269, 208, 262,   1]])
decoded_ids is tensor([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0])
< SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS SOS

相关文章:

  • 水务+AI应用探索(一)| FastGPT+DeepSeek 本地部署
  • 团体程序设计天梯赛-练习集——L1-041 寻找250
  • nlf 3d pose 部署学习笔记
  • (尚硅谷 Java 学习 B 站大学版)Day17 多态练习
  • 目标检测IoU阈值全解析:YOLO/DETR模型中的精度-召回率博弈与工程实践指南
  • String、StringBuffer、StringBuilder 区别
  • Spring Boot 如何实现自动配置?
  • 箭头函数的this指向谁
  • trl + 大模型reward训练
  • 【大模型】DeepSeek使用与原理解析:从V3到R1
  • 424个蒙太奇电影风格空气 、火焰 、飞越、运动、岩石、车、水通用嗖嗖声音效库
  • Python----Python高级(网络编程:网络高级:多播和广播,C/S架构,TCP,UDP,网络编程)
  • 蓝桥与力扣刷题(230 二叉搜索树中第k小的元素)
  • Java项目《苍穹外卖》BUG修复记录
  • 微分方程(Blanchard Differential Equations 4th)-补充习题03
  • windows11 wsl报错
  • 总部年会天府感怀
  • 动态规划 之 数组长度加长规避初始化
  • internVL的本地部署微调实践——L2G4
  • 标准输入输出流,面向对象,构造函数
  • 2025江西跨境电子商务发展交流会召开,探索行业发展新趋势
  • 新华时评:任凭风云变幻,中俄关系从容前行
  • 轿车追尾半挂车致3死1伤,事故调查报告:司机过分依赖巡航系统
  • 外交部:印巴都表示不希望局势升级,望双方都能保持冷静克制
  • 李云泽:将加快出台与房地产发展新模式相适配的系列融资制度
  • 体坛联播|国米淘汰巴萨晋级欧冠决赛,申花击败梅州避免连败