当前位置: 首页 > wzjs >正文

手机在线建网站昆明网站seo诊断

手机在线建网站,昆明网站seo诊断,制作一个官网,浙江省建设厅执业资格注册中心网站今天我们来看开源相关进展,看两个问题。 一个是大模型用于文本纠错开源工具,有一些模型跟数据,可以做个记录。 另外,在语音方面,也有一些语音转写或者对话的大模型,也做个技术汇总,看看有哪些…

今天我们来看开源相关进展,看两个问题。

一个是大模型用于文本纠错开源工具,有一些模型跟数据,可以做个记录。

另外,在语音方面,也有一些语音转写或者对话的大模型,也做个技术汇总,看看有哪些模型,哪些数据,哪些tokenizer。

一、大模型用于文本纠错开源工具

先看NLP进展,中文拼写和语法纠错大模型,https://github.com/TW-NLP/ChineseErrorCorrector,支持中文拼写和语法错误纠正,并开源拼写和语法错误的增强工具。

具体功能上,支持缺字漏字、错别字错误、缺少标点、错用标点、主语不明、谓语残缺、宾语残缺、其他成分残缺、虚词多余、其他成分多余、主语多余、语序不当、动宾搭配不当、其他搭配不当共 14种错误。

图片

开放模型上,大模型训练代码,给出了多个模型,有4B、7B和1.5j几个版本,如https://huggingface.co/twnlp/ChineseErrorCorrector3-4B,具体如下:

图片

训练数据上,使用200万纠错数据进行全量训练,适用于语法纠错和拼写纠错,也开源了数据集,数据集如下:

图片

二、语音大模型的技术总结

语音大模型进展,Awesome-SpeechLM-Survey,涵盖了50多种语音语言模型,提供丰富的模型资源,《Recent Advances in Speech Language Models: A Survey》: https://github.com/dreamtheater123/Awesome-SpeechLM-Survey

图片

其中重点的,可以看:

1、目前有哪些训练数据集:

图片

2、目前对于语音的tokenizer:

图片

3、目前主流的语音大模型:

图片

http://www.dtcms.com/wzjs/829569.html

相关文章:

  • 简单的网站建设公司的模板去视频网站做编辑器
  • 重庆网站建设 最便宜台州百度推广优化
  • 横沥镇网站建设php装饰公司网站源码
  • 服务器怎么做看视频的网站seo外包公司
  • 建站平台选择建议济南外贸网站制作
  • 在哪几个网站里可以做淘客wordpress批量移动产品
  • 天猫网站做的比京东好营销型建设
  • 网站优化新闻网站开发的工作好做吗
  • 做网站的公司天津佛山有什么网站
  • 做网站月入7000快速网页开发
  • 用护卫神做网站深圳网站设计
  • 十佳网站广州网站建设开发团队
  • 怎么看网站哪个公司做的苏州门户网站有哪些
  • 灵寿网站建设毕业设计做网站怎么做
  • 高端网站建设步骤网站建设選平台
  • 陕西 网站建设首选公司建网站的服务器
  • saas是不是做网站宁波seo外包平台
  • 站长素材官网襄汾县住房和建设局网站
  • 怎么创建收费网站备案中网站名称
  • 周至做网站的公司在那个上面做网站都能搜到
  • 网站项目建设所需成本网站编程技术
  • 电影网站制作模板服装定制费用
  • 帮人家做家务的网站上海庭院景观设计公司
  • 天津网站推广外包金融网站模板源代码
  • 心理网站的建设与维护WordPress手机导航登陆代码
  • 塔城市建设局网站叙述一个网站的建设过程
  • 深圳高端网站建设多少钱优化图片传网站
  • 做网站推广好做么wordpress 风格 切换
  • 专门做特产的网站辽源市建设局网站
  • 青岛网站建设培训学校网站推广的方法