当前位置：首页 > news >正文

bert模型笔记

news 2025/10/14 12:19:50

1.各预训练模型说明

在这里插入图片描述
BERT模型在英文数据集上提供了两种大小的模型，Base和Large。Uncased是意味着输入的词都会转变成小写，cased是意味着输入的词会保存其大写（在命名实体识别等项目上需要）。Multilingual是支持多语言的，最后一个是中文预训练模型。

在这里我们选择BERT-Base，Uncased。下载下来之后是一个zip文件，解压后有ckpt文件，一个模型参数的json文件，一个词汇表txt文件。

2.参数错误

当输出出现 args = parser.parse_args()标红时，将 args = parser.parse_args() 替换为：args, unknown = parser.parse_known_args()

3.命令行转换模型（tf到pytorch）chinese_L-12_H-768_A-12

安装：pip install pytorch-pretrained-bert
解压地址：export BERT_BASE_DIR=/path/to/bert/chinese_L-12_H-768_A-12

（地址拼接）转换模型：pytorch_pretrained_bert convert_tf_checkpoint_to_pytorch $BERT_BASE_DIR/bert_model.ckpt $BERT_BASE_DIR/bert_config.json $BERT_BASE_DIR/pytorch_model.bin

4.bert模型的标签

标签默认为0，1，2...n的方式标注，否则需转换。

查看全文

http://www.dtcms.com/a/55201.html

vim基本操作及常用命令

【PLL】分频器：其他拓扑

Linux 进程管理

大白话html语义化标签优势与应用场景

git如何解除远程仓库改变远程仓库地址

Elasticsearch为索引设置自动时间戳，ES自动时间戳

杂项知识笔记搜集

【由技及道】量子跃迁部署术：docker+jenkins+Harbor+SSH的十一维交付矩阵【人工智障AI2077的开发日志011】

Java算法语法学习美丽子集的数目 - 力扣 Map接口

2025软件测试面试八股文（含答案+文档）

传输协议优化的博弈三角

Nginx 跨域配置详细讲解

DeepSeek 助力 Vue3 开发：打造丝滑的表格（Table）之功能优化，基础加载状态,Table8基础加载状态

【并发编程】聊聊定时任务ScheduledThreadPool的实现原理和源码解析

java字符串

【Linux】线程同步与互斥

如何在PHP爬虫中处理异常情况的详细指南

unsigned类型与signed类型的区别介绍

NAS和网盘可以同步吗？

requestAnimationFrame 和定时器的含义，使用场景及区别

Unity AI 技术浅析（二）

C#程序加密与解密Demo程序示例

计算机毕业设计SpringBoot+Vue.js智能家居系统(源码+文档+PPT+讲解)

如何对数据库进行备份

链表双指针经典习题

为什么要开源？

lsblk命令linux查询设备信息

深度学习入门指南

while-经典面试题实战

c++ 类成员指针及其与`std::bind`交互使用的简单说明

1.各预训练模型说明

2.参数错误

3.命令行转换模型（tf到pytorch）chinese_L-12_H-768_A-12

4.bert模型的标签

相关文章：