当前位置: 首页 > wzjs >正文

做非经营网站需要营业执照个人域名可以做企业网站吗

做非经营网站需要营业执照,个人域名可以做企业网站吗,河南工程学院网站建设,常见网站结构有哪些【AI】使用 Hugging Face Transformers 进行文本摘要实现 推荐超级课程: 本地离线DeepSeek AI方案部署实战教程【完全版】Docker快速入门到精通Kubernetes入门到大师通关课AWS云服务快速入门实战目录 【AI】使用 Hugging Face Transformers 进行文本摘要实现Hugging Face Tra…

【AI】使用 Hugging Face Transformers 进行文本摘要实现

推荐超级课程:

  • 本地离线DeepSeek AI方案部署实战教程【完全版】
  • Docker快速入门到精通
  • Kubernetes入门到大师通关课
  • AWS云服务快速入门实战

目录

  • 【AI】使用 Hugging Face Transformers 进行文本摘要实现
    • Hugging Face Transformers 概述
    • 为什么选择 `google/pegasus-cnn_dailymail` 模型?
    • 先决条件
    • 数据摄取
    • 数据验证
    • 数据转换
    • 模型训练
    • 模型评估
    • 预测
    • 结论

我们将构建一个用于总结摘要的模型
在这里插入图片描述

文本摘要是 Hugging Face Transformers 提供的一个强大功能。它允许我们从大量文本中生成简洁的摘要。这在处理大量文本数据并需要以简短易读的格式提取核心思想时特别有用。

Hugging Face Transformers 概述

transformers 库是 TensorFlow 2.0 和 PyTorch 上的最先进的自然语言处理 (NLP) 库。它提供了数千个预训练模型来执行文本上的各种任务,如分类、信息提取、摘要、翻译、文本生成等。
利用预训练模型可以显著降低计算成本,节省宝贵的时间和资源,这些资源和时间原本会用于从头开始训练模型。这些模型支持跨不同模态的各种任务,包括自然语言处理 (NLP)、计算机视觉、音频和多模态任务。
在本教程中,我们将使用 google/pegasus-cnn_dailymail 模型。

为什么选择 google/pegasus-cnn_dailymail 模型?

Pegasus 模型是在 CNN/DailyMail 数据集上训练的,专为抽象文本摘要而设计。CNN/DailyMail 数据集是文本摘要任务的流行选择。
这个模型标识符可以使用 Hugging Face Transformers 库提供的 from_pretrained 方法来加载预训练模型。

model = "google/pegasus-cnn_dailymail"  tokenizer = AutoTokenizer.from_pretrained(model)  
model_pegasus = AutoModelForSeq2SeqLM.from_pretrained(model).to(device)

先决条件

在开始之前,请确保已安装必要的库。在终端中运行以下命令:

pip install transformers[sentencepiece] datasets sacrebleu rouge_score py7zr -q  
pip install --upgrade accelerate  
pip uninstall -y transformers accelerate  
pip install transformers accelerate

accelerate 库是一个轻量级的解决方案,用于在多种类型的硬件上训练和部署机器学习模型。它提供了一个简单的 API,用于将模型训练卸载到 GPU,并且与 PyTorch 和 TensorFlow 兼容。
本教程需要以下 Python 库:

from transformers import pipeline, set_seed  
from datasets import load_dataset, load_from_disk, load_metric  
import matplotlib.pyplot as plt  
from datasets import load_dataset  
import pandas as pd  
from transformers import AutoModelForSeq2SeqLM, AutoTokenizer  
import nltk  
from nltk.tokenize import sent_tokenize  
from tqdm import tqdm  
import torch  
nltk.download("punkt")  from transformers import DataCollatorForSeq2Seq  
from transformers import TrainingArguments, Trainer

load_dataset:这是 datasets 库提供的一个函数,允许您加载一个数据集。您可以使用它从 Hugging Face Hub 或本地文件加载数据集。
load_from_disk:这是 datasets 库提供的一个函数,允许您加载已保存到磁盘的数据集。如果您的数据集太大,无法全部加载到内存中,这可能会很有用,因为 datasets 库使用内存映射,允许您在不将整个数据集加载到内存的情况下加载数据集。
AutoModelForSeq2SeqLM:这用于将一个序列转换为另一个长度相同的序列的任务(例如,翻译、摘要、文本生成)。
AutoTokenizer:这用于对文本进行标记化。
如果您有 GPU,您可以选择使用 CUDA 来执行训练和评估过程。如果没有 GPU,系统将默认使用 CPU。

device = "cuda" if torch.cuda.is_available() else "cpu"

数据摄取

首先,我们需要从 Hugging Face 下载 SamSum 数据集。您可以使用以下链接下载它:
samsum · Hugging Face 上的数据集
下载后,解压数据并使用 load_from_disk 库加载数据集。记得指定数据集的路径。

dataset_samsum = load_from_disk('samsum_dataset')  
dataset_samsumdef download_file():  if not os.path.exists(local_data_file):  filename, headers = request.urlretrieve(  url = source_URL,  filename = local_data_file  )  def extract_zip_file():  unzip_path = unzip_dir  os.makedirs(unzip_path, exist_ok = True)  with zipfile.ZipFile(local_data_file, 'r') as zip_ref:  zip_ref

文章转载自:

http://ZdbfXiQ3.Ldmtq.cn
http://kOf9UezC.Ldmtq.cn
http://2hWD2gIR.Ldmtq.cn
http://FzjWAXA5.Ldmtq.cn
http://Q4i6odUE.Ldmtq.cn
http://M8A9wUCf.Ldmtq.cn
http://VLAtrr6m.Ldmtq.cn
http://BbUBJFu6.Ldmtq.cn
http://58ijgpsf.Ldmtq.cn
http://RRbOQQQP.Ldmtq.cn
http://Gw0AikkW.Ldmtq.cn
http://h95xZJOp.Ldmtq.cn
http://01JRZg1r.Ldmtq.cn
http://MPFSxuN7.Ldmtq.cn
http://lq4tUkMB.Ldmtq.cn
http://pLPi95fG.Ldmtq.cn
http://g10kk4ml.Ldmtq.cn
http://xEjP39op.Ldmtq.cn
http://8jxv6xmu.Ldmtq.cn
http://37aJDAoh.Ldmtq.cn
http://QpkDEhz9.Ldmtq.cn
http://USO3iob8.Ldmtq.cn
http://3aoFVZrV.Ldmtq.cn
http://QKdgR0gm.Ldmtq.cn
http://4mVDEy24.Ldmtq.cn
http://OEfNWYwD.Ldmtq.cn
http://zCTqD8Zb.Ldmtq.cn
http://7nk4iXRg.Ldmtq.cn
http://fqS458bP.Ldmtq.cn
http://X2wnScgb.Ldmtq.cn
http://www.dtcms.com/wzjs/767466.html

相关文章:

  • 怎么更改网站首页图片尺寸网站开发 支付宝订单号
  • 杭州市建设工程交易中心网站wordpress mysql安装
  • 温州网站建设培训快速搭建网站视频
  • 外贸网站如何做推广多少钱hxsp最新域名是什么
  • 去哪里购买网站空间wordpress修改页面组件
  • 网站建设 php庄行网站建设
  • 四川华泰建设集团网站潭州学院网站建设报名
  • 网站seo搜索引擎优化教程张雪峰谈电子商务
  • 桂阳城乡建设局网站seo优化网站优化排名
  • 网站模板套用教程微网站开发手机模拟器
  • 制作网站设计作品网站推广计划表
  • 网站设计个人心得五棵松网站建设
  • 阿里云服务器创建网站wordpress内容页插件
  • 一个空间怎么放多个网站吗网站建设开票税收分类
  • 网站的换肤功能怎么做搭建网站干什么
  • 佛山seo关键词排名seo专员是什么职位
  • 花溪网站建设创建全国文明城市标语口号
  • 企业vi品牌设计郑州粒米seo顾问
  • 两性做受技巧视频网站常州网站推广软件厂家
  • wordpress手机端网站模板网站宣传工作
  • 重庆网站建设莉蛋糕网站网页设计
  • 帮企业做网站前景怎么样安阳区号码
  • 帝国cms 做的完整的网站有没有承德网站建设有限公司
  • 毕业设计代做网站价格如何拍做美食的视频网站
  • 网站共用数据库手机app软件开发哪里好
  • 网站建站建设公司全球华设计大奖
  • 做校园网站搜索引擎中 哪些网站可以获得更好的排名
  • 象屿做核放单的网站苏州设计公司排行榜
  • 高端网站制造Wordpress大前端DUX5.0主题
  • 自建网站做电商中恒建设职业技术培训学校网站