当前位置：首页 > news >正文

【WAIC 2025】AI安全的攻防前线：合合信息AI鉴伪检测技术

news 2025/10/29 14:42:05

【WAIC 2025】AI安全的攻防前线：合合信息AI鉴伪检测技术

01｜写在前面
02｜AI安全的攻防
- 1️⃣ 人脸视频篡改检测：从“假脸”识别，到AI诈骗预防
- 2️⃣ AIGC图像鉴别：用MLLM给图像真伪做逻辑推理
- 3️⃣ TextIn通用篡改检测平台：图文双模检测护航真实合规
03｜产业化：数据、比赛、标准
04 | QA环节
- 伪造检测的“两个世界”：局部篡改 vs 整体生成
- 部署闭环、平台协同：合合信息的系统思维值得借鉴
05｜总结：图像伪造检测已进入“系统战”阶段，单点技术远远不够

请添加图片描述

🌈你好呀！我是是Yu欸 🚀 感谢你的陪伴与支持~ 欢迎添加文末好友 🌌 在所有感兴趣的领域扩展知识，不定期掉落福利资讯(*^▽^*)

在这里插入图片描述

2025年7月27日 @WAIC

01｜写在前面

版权声明：本文为原创，遵循 CC 4.0 BY-SA 协议。转载请注明出处。

7月WAIC展会上，我看到了“AI全景图”：底层硬件、上层应用、终端设备、具身智能机器人…… 其中，大模型与具体行业应用深度融合的创新成果大量涌现，展现出百花齐放的产业活力。

几年前还很难想象，一张完整、高清、逼真的护照照片，仅仅需要喂Prompt给Midjourney，再用PS简单拼接一下就能搞定；一个视频会议中的“我”，其实是deepfake模型在后台实时换脸，还能根据语音同步表情。

在这里插入图片描述
随着扩散模型（diffusion models）和多模态大语言模型（MLLM）技术爆发，内容伪造的成本正在逐步降低。

当我这几天在 WAIC 2025世界人工智能大会 上看到合合信息展出的完整AI鉴伪产品矩阵时，意识到在业界，内容安全已经不是“后处理问题”，而是AI时代基础设施级的问题。

而合合信息，正是国内这个赛道中的一家公司。

这篇文章，既是一份我和他们团队线下技术交流的记录，也是一份AI图像鉴伪方向的系统观察。希望能帮更多对AI内容安全有兴趣的技术同仁，快速建立完整的技术地图（p.s.一些敏感的技术内容删了）。

02｜AI安全的攻防

我在WAIC 2025 展台上体验了三款产品：人脸视频篡改检测、AIGC图像鉴别、TextIn通用篡改检测平台，就是他们这个安全体系的三个支柱。

1️⃣ 人脸视频篡改检测：从“假脸”识别，到AI诈骗预防

在展台的交互区，我体验了一个项目：我站在摄像头前，系统实时生成了一个“数字假面”，然后平台用它自研的人脸鉴伪模型对换脸视频做实时检测。

结果显示，系统不仅判断“这是伪造”，还能直接在画面上打出伪造评分，其评分依据是伪造区域——包括光影不合理、光影冲突、纹理冲突等。

在这里插入图片描述

这类伪造视频，很多是实时生成的。我们知道，这类算法已经非常成熟，几秒钟就能合成大量视频片段。

合合信息的方案采用了多尺度视觉编码网络 + 跨帧一致性检测 + 高频纹理偏差捕捉等技术，保证模型能在毫秒级检测出伪造区域，且具有跨算法的泛化能力。

并且，对主流Deepfake方法（Roop、FaceSwap、Face2Face等）均有良好鲁棒性。

并且，这套系统可以在多个银行、保险、远程核身场景中使用，支持网页API接入、SaaS部署，可以在CPU上运行，适配国产环境。

2️⃣ AIGC图像鉴别：用MLLM给图像真伪做逻辑推理

现场的“名画找茬”活动里，我肉眼都分不清真假，但模型一眼判别名画真假，很有意思。

在这里插入图片描述

它可以有效识别 MidJourney、Stable Diffusion、StyleGAN、GPT-4o 等主流AIGC图像，准确率超90%。

传统方法大多是判别式模型，输出 0/1。而这里开始往解释性推理靠近，提取图像频谱、压缩特征、视角不一致点。比如：

“这个图像假，是因为人物的影子与光源方向不一致”；
“画面中的远景比例异常，与真实透视冲突”。

这个技术方向感觉很符合未来可信AI的趋势，如何让模型不仅判断真假，还能“说清楚为什么”。

期待合合信息后续的表现。

3️⃣ TextIn通用篡改检测平台：图文双模检测护航真实合规

相比人脸图像，文档伪造往往隐藏得更深：一个身份证改个出生日期，一张发票涂掉金额，哪怕是10个像素级的修改，就足以骗过OCR和人眼。

在这里插入图片描述

合合信息的TextIn平台支持十几种常见证照类型（身份证、护照、行驶证、驾驶证、港澳台证件等），毫秒级检测。在适配场景下，误检率低至 千分之一。并且，适配压缩、裁剪、转码、截图等各种现实“干扰因素”。

这种技术是内容可信合规系统的底层模块，尤其适用于金融级风控场景。

目前结合上百万文档伪造样本训练，已落地银行、证券、保险等多个领域。

03｜产业化：数据、比赛、标准

很多人提起合合信息，第一反应是“扫描全能王”。确实，它们开始时是做文档图像处理起家的，OCR、名片识别、发票解析都是强项。

但正是因为这个出身，它们比很多“大模型热”背景下的新AI公司，更早地意识到一个事实：

伪造图像不是单一问题，而是“图像识别-数据抽取-内容合规”整个链条的挑战。

所以这几年，合合信息把视觉安全相关的工作系统性整合，在图像内容安全上构建了“三大检测系统”，同时搭配完整的文字识别、结构化解析、流程集成，实现了真正的 端到端闭环能力。

技术再好，没有数据和标准支撑也很难走向产业化。合合信息在这方面也下了苦功：

数据集：

图像伪造类：CASIA、MIML；
文档伪造类：TextTamper、DocTamper；
自建标注数据用于训练和微调，推动了算法从“小样本实验”走向“大规模泛化”。

比赛成绩：

ICDAR 2023“文本篡改检测”赛道总冠军；
全球AI攻防挑战赛金融场景赛道冠军；
AFAC金融数据验证挑战赛（700+参赛队）。

标准与治理：

参编《文本图像篡改检测系统技术要求》；
入选“护证计划”首批技术支撑单位（中国信通院发起）；
联合推动伪造检测行业平台建设与数据共享机制。

这些工作表明：他们不仅做技术，更在构建AI安全的产业生态闭环。

04 | QA环节

这一部分，在活动的技术交流环节中，合合信息请来了图像算法研发总监郭丰俊博士，向我们介绍了这一领域正在进行的探索。

伪造检测的“两个世界”：局部篡改 vs 整体生成

和我们展开聊了聊：

传统图像篡改，往往是局部的，比如修改证件号码、删改合同金额、合成发票的时间戳。这样的伪造属于图像局部篡改类问题，往往肉眼可以察觉，但由于分布不一，检测依然具有挑战性。

而AIGC图像，是整体生成出来的“假图”，它的视觉一致性往往更高，尤其在Midjourney、SD等模型多次训练下，表面上几乎完美。但这类图反而在语义逻辑、结构完整性、视觉错位等层面存在微妙的漏洞。

所以，他们有两个针对性的检测策略：

对PS等局部篡改，强调像素级感知、局部掩膜输出、图像与OCR结构比对；
对AIGC整体生成，更侧重频域残留、视觉推理逻辑、全图合理性建模。

合合信息在产品设计上就按照这两个方向做了系统区分。

部署闭环、平台协同：合合信息的系统思维值得借鉴

在交流时，还了解了一些实际落地细节。比如：

支持网页API（可配置参数）、SaaS云平台、私有部署，甚至支持国产CPU运行；
所有检测模块支持与自家OCR系统联动，形成完整业务闭环；
业务场景包括接入金融、保险、互联网等场景中，与RPA流程、企业风控系统深度融合；
图像安全体系还在逐步扩展，未来会融入更多内容审计模块，打造“图像可信生态”；

也就是说，他们不仅在做检测模型，而是在做“可信内容中台”。

05｜总结：图像伪造检测已进入“系统战”阶段，单点技术远远不够

图像伪造检测，已经不是模型层面的“点状对抗”，而是跨数据 → 模型 →流程 →解释的“系统工程”。

我在读论文过程中，有一点感受：仅靠一个F1值高的检测器，根本无法应对实际场景中的压缩图、截图、拼图、调色伪造。而合合信息在产业落地中走出的路径，或许正是我们研究者需要补的一课。

期待未来“内容信任时代”的技术建设，可能会有越来越多研究者、开发者、产品团队，关注到这条“伪造攻防战线”背后的真正技术挑战。

🧭完结撒花。

查看全文

http://www.dtcms.com/a/317123.html

基于Vue+Node.js（Express）实现（Web）物联网的蔬菜大棚温湿度监控系统

Google地图的“网络定位”功能

中国移动h10g-01_S905L处理器安卓7.1当贝纯净版线刷机包带root权限_融合终端网关

Spring Boot 参数校验全指南

学习日志29 python

猫头虎AI分享：Claude Opus 新版 4.1 在 SWE-bench Verified 上准确率达到了 74.5%，在多文件代码重构方面表现突出

力扣经典算法篇-44-组合总和(回溯问题）

Qt菜单栏与工具栏实战

Linux86 sheel流程控制前瞻4 判断vsftpd服务启动，如果启动，打印端口号，进程id

基于FFmpeg和HLS的大文件分片传输方案

SRS简介及简单demo

豆包新模型与PromptPilot工具深度测评：AI应用开发的全流程突破

神经网络搭建对CIFAR10数据集分类

生成式AI如何颠覆我们的工作和生活

深度学习（pytorch版）前言：环境安装和书籍框架介绍

【Canvas与三角形】黑底回环金片三角形

如何解决网页视频课程进度条禁止拖动？

DHCP 服务器与DNS服务器

QML开发：QML中的基本元素

JAVA高级编程第六章

深入解析Java NIO在高并发场景下的性能优化实践指南

Kubernetes服务发现、名称解析和工作负载

如何根据枚举值，快速方便显示对应枚举含义 js

大疆无人机连接Jetson主板

hive专题面试总结2

疯狂星期四文案网第31天运营日记

GitHub Spark公共预览版上线

Sourcetree GIT 可视化工具安装全攻略

Maven补充

【Linux内核系列】：信号（上）

【WAIC 2025】AI安全的攻防前线：合合信息AI鉴伪检测技术

01｜写在前面

02｜AI安全的攻防

1️⃣ 人脸视频篡改检测：从“假脸”识别，到AI诈骗预防

2️⃣ AIGC图像鉴别：用MLLM给图像真伪做逻辑推理

3️⃣ TextIn通用篡改检测平台：图文双模检测护航真实合规

03｜产业化：数据、比赛、标准

04 | QA环节

伪造检测的“两个世界”：局部篡改 vs 整体生成

部署闭环、平台协同：合合信息的系统思维值得借鉴

05｜总结：图像伪造检测已进入“系统战”阶段，单点技术远远不够

相关文章：