当前位置: 首页 > news >正文

06.AI搭建preparationの(transformers02)bertmodel实现bert-base-chinese的编码

一、下载

google-bert/bert-base-chinese at main

 

二、简介:

该模型的主要作用是获取每个汉字的向量表示,后续通过微调可应用于各种简体和繁体中文任务。

三、环境与设备:

pycharm:2024

torch:2.2.0+cu118

tensorflow2.6.0

python:3.9

transformers:4.32.0(4.3X系列应该都可以)目前镜像更新到4.50.0

 在IDE进行进一步检测:

import sys
import tensorflow as tf
import torch
import transformers

if __name__ == '__main__':
    print(sys.version)#查看当前Python版本
print(tf.test.is_built_with_cuda())# 判断CUDA是否可以用
print(tf.config.list_physical_devices('GPU'))#测试 tensorflow-gpu 是否安装正确
print(torch.__version__)#输出torch版本
x = torch.rand(5, 3)
print(x)#简单torch运算
print(torch.cuda.is_available())#测试是否支持cuda,ture是支持,否则仅CPU
print(transformers.__version__)#transformers版本

四、实操含解释:

import torch
from transformers import BertTokenizer, BertModel#引用库
#加载模型和分词器,form_pretrained()函数: 用于加速加载(下载)预训练模型及其配套的分词器
model_path = "./bert-base-chinese"#模型的路径

tokenizer = BertTokenizer.from_pretrained(model_path)#下载分词工具
model = BertModel.from_pretrained(model_path)#下载模型

def encode_text_with_bert(text):#函数将使用bert-base-chinese模型对其进行编码,并返回编码后的张量,这个张量可以被用于后续的机器学习或深度学习任务。
    # 使用tokenizer对文本进行编码,并去掉起始和结束标志
    encoded_text = tokenizer.encode(text)[1: -1]
    # 把列表转成张量
    encoded_tensor = torch.LongTensor([encoded_text])
    # 不自动进行梯度计算
    with torch.no_grad():
        output = model(encoded_tensor)
    # 返回编码后的张量(取last_hidden_state)
    return output[0]
if __name__ == '__main__':
    text1 = "床前明月光,"
    result = encode_text_with_bert(text1)
    print('text1编码的形状:', result.size())
    print('text1编码:\n', result)

相关文章:

  • 论文阅读笔记——PointVLA: Injecting the 3D World into Vision-Language-Action Models
  • DevEco Studio编辑器的使用-代码code Linter检查
  • 【博客】使用GithubAction自动同步obisidian和hexo仓库
  • QTableView开发入门
  • @DeclareParents 注解实现接口功能增强:Spring中通过接口引入实现功能增强的完整示例
  • 保存预测图像时出现的文件名错误
  • Python----机器学习(KNN:决策边界,决策边界计算,交叉验证步骤)
  • ansible介绍以及安装
  • C++练习
  • C# dataGridView 自动生成几行几列及手动输入整型字符
  • nginx https配置
  • 【算法】并查集基础讲解
  • 每日c/c++题 备战蓝桥杯(全排列问题)
  • DEEPSEEK创业项目推荐:
  • pytorch中不同的mask方法:masked_fill, masked_select, masked_scatter
  • MySQL 当中的锁
  • 网络运维学习笔记(DeepSeek优化版)026 OSPF vlink(Virtual Link,虚链路)配置详解
  • 深度学习 Deep Learning 第13章 线性因子模型
  • PyQt6实例_批量下载pdf工具_批量pdf网址获取
  • 3.30学习总结 Java包装类+高精度算法+查找算法
  • 北京网站建设报价/产品推广的目的和意义
  • 淘宝电商平台网站/如何推广网址链接
  • 营销型网站建设比较好/整站优化和单词
  • 模板网站多钱/推广公司有哪些
  • 律师事务所网站建设策划方案/市场运营和市场营销的区别
  • 做暧日本视频观看网站/快速排名刷