当前位置: 首页 > news >正文

论文阅读:2024-NAACL Semstamp、2024-ACL (Findings) k-SemStamp

总目录 大模型安全相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328

Semstamp: A semantic watermark with paraphrastic robustness for text generation
https://aclanthology.org/2024.naacl-long.226/

k-SemStamp: A Clustering-Based Semantic Watermark for Detection of Machine-Generated Text
https://aclanthology.org/2024.findings-acl.98/

github:https://github.com/abehou/SemStamp

https://www.doubao.com/chat/2065458618013954

GitHub代码和对应论文均围绕基于水印的AI生成文本检测展开。

  • 论文核心内容:论文《SemStamp: A Semantic Watermark with Paraphrastic Robustness for Text Generation》提出SemStamp算法,旨在解决现有水印生成算法易受释义攻击的问题。该算法在句子语义表示上进行水印嵌入,利用局部敏感哈希(LSH)划分句子语义空间。在文本生成阶段,通过对比学习微调句子编码器,将候选句子映射到语义嵌入空间,经LSH哈希后,采用拒绝采样使生成句子落在水印有效区域;检测时,对生成文本中有效区域句子数量进行单比例z检验,判断文本是否为机器生成。同时,论文提出双词释义攻击方法,用于测试水印算法的鲁棒性。实验表明,SemStamp在多种释义器和领域上比之前的方法更鲁棒,且能更好地保持生成文本质量。
  • GitHub代码功能:该代码库为论文的实现提供支持,涵盖SemStamp和k-SemStamp两个算法。其中,SemStamp利用LSH划分高维嵌入空间,使生成文本的LSH哈希值符合伪随机控制序列,检测时分析输入句子的LSH哈希值并进行z检验判断文本是否带水印;k-SemStamp是SemStamp的变体,使用k-means聚类划分嵌入空间,生成和检测过程与SemStamp类似 。代码库提供了详细的安装指南和使用示例,包括数据加载、模型微调、文本生成、释义和检测等步骤,方便使用者复现论文实验结果和进行自定义文本生成与检测。

相关文章:

  • 10-- 网络攻击防御原理全景解析 | 从单包攻防到DDoS军团作战(包你看一遍全记住)
  • Servlet
  • 关于波士顿动力2025年3月的人形机器人最新视频
  • 获取MSVC链接过程的详细信息
  • Python 赋值运算符大全集
  • vulhub靶机----基于docker的初探索,环境搭建
  • SpringBoot与Redisson整合,用注解方式解决分布式锁的使用问题
  • 【菜鸟飞】AI多模态:vsCode下python访问阿里云通义文生图API
  • redis MISCONF Redis is configured to save RDB snapshots报错解决
  • 【电源专题】案例:因没有关注Stand-by mode中的两种类别导致选型电池组保护芯片错误
  • 鸿蒙NEXT项目实战-百得知识库01
  • 【Zephyr】【一】学习笔记
  • Linux驱动开发实战之SRIO驱动(一)
  • 江小南的题目讲解
  • 继承父类的实体对象没打印出来父级属性问题
  • YOLOv5部署全场景问题解决方案手册(2025版)
  • 2025年汽车加气站操作工考试精选题库
  • postman小白教程(从入门到实战,详细教学)
  • 【鸿蒙开发】Hi3861学习笔记- OLED示例
  • Execution failed for task ‘:path_provider_android:compileDebugJavaWithJavac‘.
  • 陕西省市监局通报5批次不合格食品,涉添加剂超标、微生物污染等问题
  • 张家界一铁路致17人身亡,又有15岁女孩殒命,已开始加装护栏
  • 消息人士称俄方反对美国代表参加俄乌直接会谈
  • 美国将与阿联酋合作建立海外最大的人工智能数据中心
  • 问责!美国海军对“杜鲁门”号航母一系列事故展开调查
  • 公元1058年:柳永词为什么时好时坏?