当前位置: 首页 > news >正文

zero-shot文字分类模型

我们选择facebook的bart-large-mnli模型做分类处理,bart-large-mnli是基于自然语言推理(Natural Language Inference)的零次文字分类模型。

首先需要安装Huggingface的transformers.

pip install transformers

Huggingface的介绍页面:https://huggingface.co/facebook/bart-large-mnli。
如下示例代码,来判断 "one day I will see the world"这句话,属于三个分类中的哪一个(travel,cooking,dancing):

from transformers import pipeline

zero_shot_classifier = pipeline(
    "zero-shot-classification",
    model="facebook/bart-large-mnli"
)

sequence_to_classify = "one day I will see the world"
candidate_labels = ['travel', 'cooking', 'dancing']

classfication = zero_shot_classifier(
    sequence_to_classify,
    candidate_labels,
    multi_label=True      # 可匹配多个label分类
)
# print(classfication)

print(classfication['labels'])
print(classfication['scores'])

运行之后,得到如下结果,travel标签最为匹配,得分为0.99:

['travel', 'dancing', 'cooking']
[0.994511067867279, 0.005706176161766052, 0.0018192899879068136]

更换一组如下数据:

sequence_to_classify = "The company's quarterly earnings increased by 20%, exceeding market expectations."
candidate_labels = ["finance", "sports", "politics", "technology"]

得到结果如下,finance标签最为匹配,得分0.85:

['finance', 'technology', 'sports', 'politics']
[0.8526014089584351, 0.5210740566253662, 0.004615711513906717, 0.000885962916072458]

这次,给定一个网址,而非之前的自然语言,测试下分类情况:

sequence_to_classify = "https://nba.sina.com.cn/"

得到结果如下,sports标签最为匹配,得分为0.83。

['sports', 'technology', 'finance', 'politics']
[0.8341358304023743, 0.20186419785022736, 0.07376285642385483, 0.004406137391924858]

相关文章:

  • 【数据结构与算法】Java描述:第四节:二叉树
  • 苹果app上架app store 之苹果开发者账户在mac电脑上如何使用钥匙串访问-发行-APP发布证书ios_distribution.cer-优雅草卓伊凡
  • DeepSeek 3FS集群化部署临时笔记
  • Django中的查询条件封装总结
  • 解决 openjtalk.obj : error LNK2001: 无法解析的外部符号 __imp__PySequence_List 错误
  • C语言基础要素(016):入口条件循环:while与for
  • go 通过汇编分析栈布局和函数栈帧
  • SSM文物管理系统
  • chatgpt的一些prompt技巧
  • vue3设置全局滚动条样式
  • 1.5[hardware][day5]
  • 0CTF 2016 piapiapia 1
  • QT MVC 编程 MODEL/DELEGATE/VIEW(五)
  • day04_Java高级
  • OSPF与RIP联动实验
  • Java 并发编程——Java BIO NIO Socket编程
  • cursor全栈网页开发最合适的技术架构和开发语言
  • 进制转换(十进制相关)
  • 1.Qt SDK 的下载和安装
  • [Linux][经验总结]Ubuntu6.11.0 docker更换镜像源
  • 刘洪洁已任六安市委副书记、市政府党组书记
  • “五一”看什么?这里有一份申城视听指南
  • 解放日报:“北斗七星”列阵,AI群星闪耀
  • 北京亦庄启动青年人才创新创业生态示范区
  • 关于新冠疫情防控与病毒溯源的中方行动和立场
  • 总有黑眼圈是因为“虚”吗?怎么睡才能改善?