当前位置: 首页 > news >正文

使用Python提取照片元数据:方法与实战指南

## 引言:元数据的重要性

照片元数据(Metadata)是嵌入在图像文件中的隐藏信息,记录了拍摄设备、时间、地理位置、光圈快门参数等关键数据。这些信息广泛应用于**数字取证**、**照片管理**、**地理标记分析**和**版权验证**等场景。本文将介绍Python中三种主流元数据提取方法,并提供完整的代码实现。

---

## 一、使用Pillow库提取基础EXIF数据

### 安装与基础操作

```bash

pip install Pillow

```

### 代码示例

```python

from PIL import Image

from PIL.ExifTags import TAGS

def get_exif_pillow(image_path):

try:

img = Image.open(image_path)

exif_data = img._getexif()

if exif_data:

return {

TAGS.get(tag_id, tag_id): value

for tag_id, value in exif_data.items()

}

except (AttributeError, OSError) as e:

print(f"Error: {e}")

return None

# 使用示例

metadata = get_exif_pillow("photo.jpg")

print("拍摄设备:", metadata.get("Model", "未知"))

print("拍摄时间:", metadata.get("DateTimeOriginal", "未记录"))

```

### 特点与局限

- **支持格式**:JPEG/TIFF等格式

- **数据范围**:仅提取EXIF标准字段

- **常见问题**:部分设备自定义标签无法解析

---

## 二、使用ExifRead进行精准解析

### 安装与高级解析

```bash

pip install exifread

```

### 代码示例

```python

import exifread

def get_exif_exifread(image_path):

with open(image_path, 'rb') as f:

tags = exifread.process_file(f, details=False)

return {

str(tag): str(value)

for tag, value in tags.items()

}

# 提取GPS坐标

metadata = get_exif_exifread("photo.jpg")

gps_latitude = metadata.get("GPS GPSLatitude", "").strip("[]").split(", ")

gps_longitude = metadata.get("GPS GPSLongitude", "").strip("[]").split(", ")

```

### 优势

- 支持原始十六进制数据解析

- 更完整的EXIF标签覆盖

- 可直接处理RAW格式文件(如.CR2/.NEF)

---

## 三、使用PyExifTool实现全能解析

### 安装与配置

```bash

pip install PyExifTool

# 需预先安装exiftool:https://exiftool.org/

```

### 代码示例

```python

import exiftool

def get_all_metadata(image_path):

with exiftool.ExifToolHelper() as et:

metadata = et.get_metadata(image_path)[0]

return {

key.split(":")[-1]: value

for key, value in metadata.items()

}

# 获取XMP和IPTC数据

full_data = get_all_metadata("photo.dng")

print("作者信息:", full_data.get("Creator", "未记录"))

print("版权声明:", full_data.get("Rights", "未标注"))

```

### 核心优势

- 支持**XMP**、**IPTC**、**ICC Profile**等多标准

- 可处理**视频文件**元数据

- 保留原始数据类型(非字符串)

---

## 四、GPS坐标转换实战

### 度分秒转十进制

```python

def dms_to_decimal(dms, ref):

degrees = dms[0].num / dms[0].den

minutes = dms[1].num / dms[1].den

seconds = dms[2].num / dms[2].den

decimal = degrees + minutes/60 + seconds/3600

return -decimal if ref in ["S", "W"] else decimal

# 使用ExifRead数据示例

lat = dms_to_decimal(metadata["GPS GPSLatitude"], metadata["GPS GPSLatitudeRef"])

lon = dms_to_decimal(metadata["GPS GPSLongitude"], metadata["GPS GPSLongitudeRef"])

print(f"坐标:{lat:.6f}, {lon:.6f}")

```

---

## 五、技术选型建议

| 方法 | 适用场景 | 性能 | 数据完整性 |

|-------------|----------------------------|--------|------------|

| Pillow | 快速获取基础拍摄信息 | ★★★★☆ | ★★☆☆☆ |

| ExifRead | 专业级EXIF解析 | ★★★☆☆ | ★★★★☆ |

| PyExifTool | 跨格式元数据提取 | ★★☆☆☆ | ★★★★★ |

---

## 六、注意事项

1. **隐私安全**:删除GPS标签可使用`exiftool -GPS*= image.jpg`

2. **文件保护**:操作前备份原始文件

3. **编码问题**:使用`chardet`库处理字符编码异常

相关文章:

  • Next打包导出静态文件(纯前端),不要服务器端(node), 隐藏左下角调试模式(“next“: “^15.3.3“,)
  • python版若依框架开发:项目结构解析
  • python打卡day45
  • Qt实现一个悬浮工具箱源码分享
  • 当机械音色遇见抒情诗:IndexTTS与CosyVoice的中文语音对决
  • PS如何傻瓜式扣图、图片编辑、图片合成
  • springcloud openfeign 偶现 Caused by: java.net.UnknownHostException
  • 强化学习原理入门-2马尔科夫决策过程
  • jar包如何引入
  • C++算法动态规划1
  • Odoo电子邮件使用配置指南
  • CppCon 2015 学习:Comparison is not simple, but it can be simpler.
  • 008-libb64 你有多理解base64?-C++开源库108杰
  • AppTrace技术全景:开发者视角下的工具链与实践经验
  • GPU 图形计算综述 (三):可编程管线 (Programmable Pipeline)
  • 数据结构:递归:泰勒展开式(Taylor Series Expansion)
  • 架构师级考验!飞算 JavaAI 炫技赛:AI 辅助编程解决老项目难题
  • 单精度浮点数值 和 双精度浮点数值
  • 嵌入式学习之系统编程(十)网络编程之TCP传输控制协议
  • TDengine 开发指南—— UDF函数
  • 网页游戏折扣充值平台/成都网站优化
  • 长沙企业官方网站建设/上优化seo
  • 攻把受做哭了gv网站/房地产销售怎么找客户
  • 设计制作生态瓶教学反思/广州seo网站
  • 湖北省建设厅信息网站/网站app免费生成软件
  • 2019长沙企业网站建设优惠/百度搜索排行榜