当前位置: 首页 > news >正文

腾讯开源混元多语言翻译模型—— Hunyuan-MT

在这里插入图片描述

模型介绍

混元翻译模型包含翻译模型Hunyuan-MT-7B和集成模型Hunyuan-MT-Chimera。翻译模型用于将源语言翻译成目标语言,集成模型则对多个翻译结果进行融合,生成质量更高的译文。主要支持33种语言互译,包括5种中国少数民族语言。

核心特点与优势

  • 在WMT25竞赛中,该模型参与的31个语言方向里30个获得第一
  • Hunyuan-MT-7B在同等规模模型中达到业界领先性能
  • Hunyuan-MT-Chimera-7B是业界首个开源的翻译集成模型,将翻译质量提升至新高度
  • 完整提出了翻译模型训练框架:pretrain → 跨语言预训练(CPT) → 有监督微调(SFT) → 翻译增强 → 集成调优,在同等规模模型中达到SOTA效果

模型链接

模型名称描述下载链接
Hunyuan-MT-7B混元7B翻译模型🤗 模型下载
Hunyuan-MT-7B-fp8混元7B翻译模型(fp8量化版)🤗 模型下载
Hunyuan-MT-Chimera混元7B翻译集成模型🤗 模型下载
Hunyuan-MT-Chimera-fp8混元7B翻译集成模型(fp8量化版)🤗 模型下载

提示词

中<=>外翻译的提示词模板


把下面的文本翻译成<target_language>,不要额外解释。<source_text>

XX<=>XX 翻译的提示模板,不包括中文<=>XX。


Translate the following segment into <target_language>, without additional explanation.<source_text>

Hunyuan-MT-Chmeria-7B的提示模板


Analyze the following multiple <target_language> translations of the <source_language> segment surrounded in triple backticks and generate a single refined <target_language> translation. Only output the refined translation, do not explain.The <source_language> segment:
```<source_text>```The multiple <target_language> translations:
1. ```<translated_text1>```
2. ```<translated_text2>```
3. ```<translated_text3>```
4. ```<translated_text4>```
5. ```<translated_text5>```
6. ```<translated_text6>```

 

与transformers一起使用

首先,请安装transformers,推荐版本v4.56.0

pip install transformers==v4.56.0

以下代码片段展示了如何使用transformers库加载和应用模型。

!!! 如果想用transformers加载fp8模型,需要将config.json中的"ignored_layers"改为"ignore",并将compressed-tensors升级至compressed-tensors-0.11.0。

我们以tencent/Hunyuan-MT-7B为例。

from transformers import AutoModelForCausalLM, AutoTokenizer
import osmodel_name_or_path = "tencent/Hunyuan-MT-7B"tokenizer = AutoTokenizer.from_pretrained(model_name_or_path)
model = AutoModelForCausalLM.from_pretrained(model_name_or_path, device_map="auto")  # You may want to use bfloat16 and/or move to GPU here
messages = [{"role": "user", "content": "Translate the following segment into Chinese, without additional explanation.\n\nIt’s on the house."},
]
tokenized_chat = tokenizer.apply_chat_template(messages,tokenize=True,add_generation_prompt=False,return_tensors="pt"
)outputs = model.generate(tokenized_chat.to(model.device), max_new_tokens=2048)
output_text = tokenizer.decode(outputs[0])

我们推荐使用以下参数集进行推理。请注意,我们的模型没有默认的系统提示。

{"top_k": 20,"top_p": 0.6,"repetition_penalty": 1.05,"temperature": 0.7
}

支持的语言:

LanguagesAbbr.Chinese Names
Chinesezh中文
Englishen英语
Frenchfr法语
Portuguesept葡萄牙语
Spanishes西班牙语
Japaneseja日语
Turkishtr土耳其语
Russianru俄语
Arabicar阿拉伯语
Koreanko韩语
Thaith泰语
Italianit意大利语
Germande德语
Vietnamesevi越南语
Malayms马来语
Indonesianid印尼语
Filipinotl菲律宾语
Hindihi印地语
Traditional Chinesezh-Hant繁体中文
Polishpl波兰语
Czechcs捷克语
Dutchnl荷兰语
Khmerkm高棉语
Burmesemy缅甸语
Persianfa波斯语
Gujaratigu古吉拉特语
Urduur乌尔都语
Telugute泰卢固语
Marathimr马拉地语
Hebrewhe希伯来语
Bengalibn孟加拉语
Tamilta泰米尔语
Ukrainianuk乌克兰语
Tibetanbo藏语
Kazakhkk哈萨克语
Mongolianmn蒙古语
Uyghurug维吾尔语
Cantoneseyue粤语

文章转载自:

http://L8k9AfzF.rxwnc.cn
http://62aaeyPP.rxwnc.cn
http://wO0k5BI2.rxwnc.cn
http://dBEWCkdX.rxwnc.cn
http://PpjrMsH4.rxwnc.cn
http://uFU56biL.rxwnc.cn
http://uquwUkKv.rxwnc.cn
http://gnN6qNry.rxwnc.cn
http://sI0xgCYJ.rxwnc.cn
http://kaEB63ch.rxwnc.cn
http://3CwKBF5d.rxwnc.cn
http://fCJacOny.rxwnc.cn
http://oo2vRr1e.rxwnc.cn
http://6lblRe4p.rxwnc.cn
http://igbhCNwx.rxwnc.cn
http://8wnwA3MK.rxwnc.cn
http://e8TW4xBt.rxwnc.cn
http://BJtdsTwp.rxwnc.cn
http://ZxXdbjaL.rxwnc.cn
http://9sSEbvZK.rxwnc.cn
http://CaNvptMb.rxwnc.cn
http://qFzIJgjo.rxwnc.cn
http://BjUCW0CQ.rxwnc.cn
http://bT55XuOg.rxwnc.cn
http://XKxwEJW0.rxwnc.cn
http://YeVN2PLR.rxwnc.cn
http://6af1xBsS.rxwnc.cn
http://5jE6EqBH.rxwnc.cn
http://thVuKv9X.rxwnc.cn
http://cB23f1BP.rxwnc.cn
http://www.dtcms.com/a/364293.html

相关文章:

  • 【算法--链表】142.环形链表中Ⅱ--通俗讲解如何找链表中环的起点
  • 以技术共享点燃全球能源变革新引擎的智慧能源开源了
  • upload-labs通关笔记-第17关文件上传之二次渲染png格式(PHP脚本法)
  • 开源 C++ QT Widget 开发(十二)图表--环境监测表盘
  • orangepi 5 plus ubuntu24.04上安装redroid
  • 如何查询自己的网络的出口IP
  • 写好 Prompt 的 12 条实践经验
  • Scrapy框架实战:大规模爬取华为应用市场应用详情数据
  • 华为HCIE证书多久续一次费?费用多少?
  • nano banana官方最强Prompt模板来了!六大场景模板详解
  • 如何将华为手机数据转移到OPPO手机
  • 《华为基本法》——企业文化的精髓,你学习了几条?
  • 车辆安全供电系统开发原则和实践
  • 利用 Java 爬虫获取淘宝商品详情 API 接口
  • 指针高级(1)
  • Meta-Learning入门:当AI学会“举一反三”——用MAML实现少样本图像分类 (Meta-Learning系列
  • Qt + windows + Linux+QtInstallerFramework打包教程
  • QNX pidin 命令中STATE 含义
  • vue2 + ts 实现透视卡片 + 瀑布上下移动效果
  • 计算机网络---CA证书体系(Certificate Authority)
  • FPGA离群值剔除算法
  • 【C++】在 Windows 系统调用第三方程序(创建进程)
  • 校园外卖点餐系统(代码+数据库+LW)
  • LeetCode 刷题【62. 不同路径】
  • 【Linux】Linux开发必备:Git版本控制与GDB调试全指南
  • ESXI8多网卡链路聚合
  • Nature Machine Intelligence 基于强化学习的磁性微型机器人自主三维位置控制
  • 【正则表达式】 正则表达式运算法优先级的先后是怎么排序的?
  • Elasticsearch(高性能分布式搜索引擎)01
  • 从“看见”到“行动”:一场机器视觉与机器人的软硬件共舞