当前位置: 首页 > news >正文

(六)PS识别:源数据分析- 挖掘图像的 “元语言”技术实现

(一)PS识别: Python 图像分析PS识别之道
 (二)PS识别: 特征识别-直方图分析的从原理到实现

(三)PS识别:基于噪声分析PS识别的技术实现

(四)PS识别:基于边缘纹理检测分析PS识别的技术实现

  (五)PS识别:压缩痕迹挖掘-压缩量化表与 DCT 系数分析

介绍

     本文介绍的 PSExifChecker 类便是利用 exifreadpiexifPIL 和 python - magic 等库,通过读取图片的 EXIF 元数据和文件信息,对图片进行多维度检测的实现。

原理

这段代码主要用于检测图片是否经过 Photoshop 处理或者是否为截图,核心原理是通过读取图片的 EXIF(Exchangeable Image File Format)元数据,根据元数据中的信息(如软件信息、拍摄设备信息等)以及图片的基本属性(如分辨率、文件类型等)来判断图片是否可疑。

实现思路

  1. 元数据读取:使用 exifread 和 piexif 库读取图片的 EXIF 元数据。
  2. 截图检测:通过检查元数据的数量、图片分辨率以及软件标签等信息判断图片是否为截图。
  3. PS 处理检测:检查元数据中的软件信息是否包含 Photoshop 或 PS,判断图片是否经过 Photoshop 处理。
  4. 设备信息检测:检查元数据中的拍摄设备信息,若截图中出现异常拍摄设备信息,则认为图片可能被修改。
  5. 文件类型检查:使用 python - magic 库检查文件类型和扩展名是否一致。

代码逻辑

import exifreadimport exifread
import piexif
from PIL import Image
import magicclass PSExifChecker:def __init__(self):passdef process_image(self, image_path):try:with open(image_path, 'rb') as f:tags = exifread.process_file(f)if not tags:return False, "无元数据"# 常见可疑点:软件信息含Photoshop、创建时间异常等software = tags.get('Image Software', '').valuesif 'Photoshop' in str(software) or 'PS' in str(software):return True, "检测到PS相关软件痕迹"camera_model = tags.get('Image Model', '').valuesif camera_model and "screenshot" not in str(camera_model).lower():return True, "截图中出现异常拍摄设备信息,可能被修改"return False, "元数据正常"except Exception as e:return False, "读取失败"+str(e)def is_ps_extract_exif_info(self, image_path):try:# 只读取指定文件格式的图片img = Image.open(image_path)img_format = img.format.upper()if img_format not in ['JPEG', 'TIFF']:return False, f"Unsupported image format: {img_format}. Only JPEG and TIFF are supported."exif_dict = piexif.load(image_path)for ifd in ("0th", "Exif", "GPS", "1st"):for tag in exif_dict[ifd]:print(f"{piexif.TAGS[ifd][tag]['name']}: {exif_dict[ifd][tag]}")# Check the amount of EXIF informationis_screenshot = len(exif_dict) == 0 or (len(exif_dict) == 1 and "0th" in exif_dict and len(exif_dict["0th"]) == 0)# Check Image Width and Image Heightif not is_screenshot:width = exif_dict["0th"].get(piexif.ImageIFD.ImageWidth)height = exif_dict["0th"].get(piexif.ImageIFD.ImageLength)if width and height:common_resolutions = [(1920, 1080),(1366, 768),(2560, 1440),(3840, 2160),]if (width, height) in common_resolutions:is_screenshot = True# Check the Software tagif not is_screenshot:software = exif_dict["0th"].get(piexif.ImageIFD.Software)if software:software_str = software.decode("utf-8", errors="ignore")screenshot_tools = ["Snipping Tool","Snip & Sketch","Greenshot","Lightshot",]for tool in screenshot_tools:if tool in software_str:is_screenshot = Truebreakif is_screenshot:print("The image may be a screenshot.")return False, "Metadata is normal."except piexif.InvalidImageDataError as e:print(f"An unknown error occurred while reading EXIF information: {str(e)}")return True, "Failed to read EXIF information. The image may have been processed or the format is not supported."except Exception as e:print(f"An error occurred while processing EXIF information: {str(e)}")return True, "该图片Exif信息错误.可能被修改"def check_file_type(self,image_path):"""检查文件类型和扩展名是否一致:param image_path: 图片文件路径:return: 检查结果"""common_screenshot_formats = ["png", "bmp", "jpg", "jpeg"]file_type = magic.from_file(image_path)file_extension = image_path.split('.')[-1].lower()print(f"File type: {file_type}")print(f"File extension: {file_extension}")#针对截图的特殊处理:检查常见截图格式的一致性if file_extension in common_screenshot_formats and file_extension not in file_type.lower():return  True,"截图文件扩展名与检测类型不一致,可能被处理过"return False, "文件类型与扩展名正常"# 启动调用
if __name__ == "__main__":checker = PSExifChecker()# 替换为你要检查的图片路径image_path = "new_img.jpg"result, message = checker.process_image(image_path)print(f"is_ps_check_exif 结果: {result}, 信息: {message}")result, message = checker.is_ps_extract_exif_info(image_path)print(f"is_ps_extract_exif_info 结果: {result}, 信息: {message}")result, message = checker.check_file_type(image_path)print(f"is_ps_extract_exif_info 结果: {result}, 信息: {message}")
#启动调用
PSExifChecker 类
  • __init__ 方法:初始化方法,目前为空。
  • process_image 方法
    1. 以二进制模式打开图片文件,使用 exifread 库读取 EXIF 元数据。
    2. 若没有元数据,返回 False, "无元数据"
    3. 检查软件信息是否包含 Photoshop 或 PS,若包含则返回 True, "检测到PS相关软件痕迹"
    4. 检查拍摄设备信息,若截图中出现异常拍摄设备信息,则返回 True, "截图中出现异常拍摄设备信息,可能被修改"
    5. 若以上条件都不满足,返回 False, "元数据正常"
  • is_ps_extract_exif_info 方法
    1. 使用 PIL 库打开图片,检查图片格式是否为 JPEG 或 TIFF,若不是则返回相应错误信息。
    2. 使用 piexif 库加载 EXIF 元数据,并打印所有元数据信息。
  • check_file_type 方法
    1. 定义常见截图文件格式。
    2. 使用 python - magic 库获取文件类型,获取文件扩展名。
    3. 若文件扩展名是常见截图格式,但文件类型不包含该扩展名,则返回 True, "截图文件扩展名与检测类型不一致,可能被处理过"
    4. 否则返回 False, "文件类型与扩展名正常"

优点

  • 多维度检测:从元数据信息、图片分辨率、文件类型等多个维度进行检测,提高了检测的准确性。。
  • 扩展性强:可以方便地添加新的检测规则,以适应不同的检测需求。

缺点

  • 误判风险:仅根据元数据信息和简单规则进行判断,可能会出现误判。例如,软件信息可能被手动修改,导致检测结果不准确。
  • 兼容性问题:只支持 JPEG 和 TIFF 格式的图片,对于其他格式的图片无法进行检测。
  • 性能问题:在处理大量图片时,多次读取文件和解析元数据可能会导致性能下降。
http://www.dtcms.com/a/268595.html

相关文章:

  • python list去重
  • 【Behavior Tree】-- 行为树AI逻辑实现- Unity 游戏引擎实现
  • Docker 将镜像打成压缩包将压缩包传到服务器运行
  • 物联网技术的关键技术与区块链发展趋势的深度融合分析
  • Java SE与Java EE使用方法及组件封装指南
  • 安卓10.0系统修改定制化_____安卓9与安卓10系统文件差异 有关定制选项修改差异
  • Java 并发编程中的同步工具类全面解析
  • qiankun隔离机制
  • [附源码+数据库+毕业论文]基于Spring+MyBatis+MySQL+Maven+jsp实现的高校实验室资源综合管理系统,推荐!
  • 按键开关:新型防水按键开关的特点!
  • 音频流媒体技术选型指南:从PCM到Opus的实战经验
  • 【Java面试】Https和Http的区别?以及分别的原理是什么?
  • 02 除了前面常见图表,还有许多更细分或专业的可视化类型,尤其是在特定领域(如金融、工程、生物信息等)。
  • GaussDB应用场景全景解析:从金融核心到物联网的分布式数据库实践
  • OpenCV 人脸分析----人脸识别的一个经典类cv::face::EigenFaceRecognizer
  • Oracle PL/SQL 编程基础详解(从块结构到游标操作)
  • idea 使用vscode 快捷键
  • UE 材质 变体 概念
  • ClickHouse 入门详解:它到底是什么、优缺点、和主流数据库对比、适合哪些场景?
  • 1.1_5_2 计算机网络的性能指标(下)
  • 【Vben3全解】【组件库开发】解决组件库开发中css的命名难题,保证代码质量,构建useNamespace函数
  • docker所占硬盘内存指令
  • 强化学习:Distributed PPO (DPPO) 学习笔记
  • Day08-Flask 或 Django 简介:构建 Web 应用程序
  • C++高频知识点(三)
  • 基于STM32设计的心率脉搏测量仪(项目资料)(ID:9)
  • 【Linux | 网络】网络编程套接字
  • Baklib作为赞助商参加RubyConf China 2025 技术大会
  • Java基础:随机数生成、循环结构与方法封装详解
  • 国产MCU学习Day10——CW32F030C8T6模拟电压比较器全解析