当前位置: 首页 > wzjs >正文

前端手机网站wordpress导入演示卡主

前端手机网站,wordpress导入演示卡主,中国软件公司有哪些,阿里巴巴国际贸易网站官网文章目录 基于知识蒸馏的半监督古籍实体抽取数据集模型实验结果 基于大语言模型的专利命名实体识别方法研究数据集评估公式实验 基于数据增强和多任务学习的突发公共卫生事件谣言识别研究数据集实验结果 参考 基于知识蒸馏的半监督古籍实体抽取 数据集 本文在有监督数据集的基…

文章目录

    • 基于知识蒸馏的半监督古籍实体抽取
      • 数据集
      • 模型
      • 实验结果
    • 基于大语言模型的专利命名实体识别方法研究
      • 数据集
      • 评估公式
      • 实验
    • 基于数据增强和多任务学习的突发公共卫生事件谣言识别研究
      • 数据集
      • 实验结果
    • 参考

基于知识蒸馏的半监督古籍实体抽取

image-20250402200901950

数据集

本文在有监督数据集的基础上构建了两个自标注数据集。通过采用不同组合形式的训练数据微调学生模型,并在两个测试数据集上进行评估。词典知识教师模型生成式知识教师模型获得的数据仅被用于训练阶段微调学生模型。验证集和测试集的构建,则通过从有监督数据中随机抽取样本来完成。

image-20250402145237616

  • 中国古代语料库:https://catalog.ldc.upenn.edu/LDC2017T14
  • GuNer2023:https://guner2023.pkudh.org/

下述是他们使用大模型标注的数据集:

image-20250402145357705

模型

image-20250402144905398

这个教师模型实质上做的是数据增强的工作。在句子中,把同一类的实体进行替换。

在表述中提到挑选字典长度一致的ekt 进行替换,这里的长度一致,我认为是作者不想花时间去修改label。

image-20250402144727760

他们提到了使用BIO标记,我个人认为实体抽取的BIO标记还没学过的就不用学了,因为现在是大模型生成式的时代。

实验结果

image-20250402153332871

基于大语言模型的专利命名实体识别方法研究

image-20250402153440913

数据集

image-20250402153541529

L.Chen 等[14]收集了专利领域和通用领域具有代表性的七个命名实体标注数据集

数据集构造过程:

image-20250402162653094

给每个实体的类型加入提示词,这一部分的提示词很难写。如果写的不好,反而效果还不如不写这个类型的说明信息。因为人所有理解的类型,与数据集中真实的类型情况可能会有偏差,反而导致加了类型说明的效果会下降。

评估公式

看到评估公式的一种新写法:

image-20250402154307111

实验

image-20250402154826194

看横坐标,第一个是Lora,其后都是不微调的基于示例的上下文学习。

论文原文:

在摘要层级任务上,LoRA 微调后的命名实体效果甚至低于仅使用 1 个示例的上下文学习方法;但在句子层级任务上,LoRA微调效果明显,虽然准确率

依然低于仅使用 1 个示例的上下文学习方法,但在召回率和 F1 值上获得最高得分。这表明微调指令的文本长度越长,大语言模型理解起来就越困难,高效微

调的提升效果就越小。

LoRA的微调效果不如提示学习,我猜测这是因为他们的微调的效果不好。(我感觉问题出在他们的LoRA微调上。根据我以往的LoRA微调经验,LoRA微调的效果要远远超过上下文学习)

现在的大模型,比如 deepseek-r1,由于使用到了强化学习,参杂很多上下文示例反而效果不会很好。基于示例的上下文学习,还有一个问题,会导致大模型混淆示例文本与要完成抽取的文本,我就遇到在ollama 7B的模型中,一些抽取出来的实体来自于前面的示例文本。
上下文示例的数量与样例的筛选,都是前一段时间热衷做的工作。这部分现在不是一个必须学的内容。

题外话:大模型抽取实体,我想起来在 EMNLP会议论文中,有一篇论文是这么做的:开源本地推理先推理一遍,再调用闭源模型再推理一遍。因为开源模型本地推理速度快,闭源模型的实力更强大可以起到最终把关的作用。

基于数据增强和多任务学习的突发公共卫生事件谣言识别研究

image-20250402163340403

主要看看CEDA方法是怎么做数据增强的。

image-20250402163513735

image-20250402163535593

数据集

哈尔滨工业大学社会计算与信息检索研究中心《同义词词林(扩展版)》[1]进行扩展,基于扩展同义词表进行同义词替换。

对CHECKED数据集[2]和腾讯事实核查平台[3]中的1062条突发公共卫生事件谣言文本进行主题、词频和权重分析。

  • [1] https://www.ltp-cloud.com/download
  • [2] https://github.com/cyang03/CHECKED
  • [3] https://vp.fact.qq.com/home

image-20250402164834964

CEDA 数据增强示例:

image-20250402163940127

实验结果

在数据增强的过程中,他们分别对每一种数据增强的方法都做了实验。

图2 探索了不同的文本改变率,对F1值的影响。

image-20250402164408160

表8 基于图2每种方法最佳的文本改变率进行的实验评估。

image-20250402164233051

参考

  • 论文下载自 中国知网
http://www.dtcms.com/wzjs/557847.html

相关文章:

  • 江门网站程序开发制作网站分享代码怎么加
  • 网站建设的前端开发和后端开发alexa排名分析
  • 做ic用什么网站网站建设办法
  • 苏州网站建设设计张家港外贸网站建设
  • 烟台网站制作效果企业网站推广方式和策略
  • 昆明网站推广价格360推广开户
  • 淘客网站怎么做返利网站开发技术应用领域
  • 如何修改网站源文件中国最大的博客网站
  • 平台企业采用劳务派遣方式用工的网站建设 猫云seo
  • 获取网站访客qq萍乡招聘网站建设
  • 创口贴网站模板介绍常见的网络营销方式
  • 亿度网络网站建设哪个网站是做韩国化妆品正品
  • 有不收费的网站网页游戏开服表时间表
  • 程序源代码下载网站鼓楼机关建设网站
  • 英文营销网站wordpress博客acg主题
  • asp.net做毕业设计网站惠州网站建设技术支持
  • 凡科建设网站如何对话框网站开发外包 合同
  • 有哪些好的做网站西安网站seo哪家公司好
  • 网络文化有限公司网站建设策划书网络规划设计师工资
  • app展示网站模板html如何进行网站网站调试
  • 网站建设犭金手指C排名15实时网站制作
  • app企业网站模板免费下载如何用自己公司网站做邮箱
  • 梧州网站建设有哪些物业管理网站开发背景
  • 宁波网站建设公司怎么报价北京建站管理系统价格
  • 企业网站建设与网页设计学什么的wordpress 内部函数
  • 如何建设个人网站和博客自己想做一个网站怎么做
  • 青州网站优化如何做网站弹窗广告
  • 昆凌做的广告买化妆品网站宝坻集团网站建设
  • 外贸网站 栏目网上哪里有卖嗅探器
  • 公司网站建设30元个性化定制网站