当前位置: 首页 > news >正文

Python--plist文件的读取

Python练习:读取Apple Plist文件

Plist文件简介

  1. ​​定义​​:Apple公司创建的基于XML结构的文件格式
  2. ​​特点​​:采用XML语法组织数据,可存储键值对、数组等结构化信息
  3. 文件扩展名​​:.plist
  4. 应用场景:
    ​​iOS系统:​​ 应用描述文件(权限配置:蓝牙/网络访问/GameCenter等)IPA安装包中的配置信息 ​​
    macOS系统​​: .app应用的配置文件 系统偏好设置存储 ​​
    苹果生态​​ iTunes音乐播放列表 Xcode项目配置

Python操作库:plistlib

import plistlib

代码适配指南(Python 2 → Python 3)
​​废弃方法​​(Python 2旧版)

plist = plistlib.read(filename)

​​正确方法​​(Python 3新版)

with open(filename, 'rb') as plist_file:plist = plistlib.load(plist_file)

注意事项

  1. 始终使用​​二进制模式​​(‘rb’)打开文件 Python
  2. 3.4+ 支持load()/dump()替代旧版API
  3. macOS内置plutil工具可验证文件有效性:bash 下运行下面的代码
    plutil -lint Example.plist

下文是练习代码,其中也包含了画图部分
练习代码:

import re, argparse
import sys
from matplotlib import pyplot
import plistlib
import numpy as np# 找到重复的音乐
def find_duplicates(file_name):print("Find duplicate tracks in %s..." % file_name)with open(file_name, 'rb') as f:plist = plistlib.load(f)# 读取playlist# 获取音轨目录tracks = plist['Tracks']# 创建音轨字典track_names = {}# 结构:{name:(duration,count)}# 遍历 添加for track_id, track in tracks.items():try:name = track['name']duration = track['Total Time']# 检查是不是以及在在字典里面了if name in track_names:# 匹配 歌曲名称和时长if duration // 1000 == track_names['name'][0] // 1000:count = track_names[name][1]track_names[name] = (duration, count + 1)else:# 不匹配的情况下track_names[name] = (duration, count)except:# ignorepass# 保存重复的音轨, name, countdups = []for k, v in track_names.items():if v[1] > 1:dups.append(k, v[1])# 保存到一个文件if len(dups) > 0:print("发现一共有%d个重复的文件, 以及保存到了dup.txt中" % len(dups))else:print("没有发现任何重复的文件")f = open("dups.txt", "w")for val in dups:f.writable("[%d] %s \n" % (val[0], val[1]))f.close()# 查找多个播放列表中的共同的音轨
def find_common_tracks(file_names):# a list of sets of track namestrack_name_sets = []# 遍历读取多个plist文件for file_name in file_names:track_names = set()with open(file_name, 'rb') as f:plist = plistlib.load(f)# 获取音轨节点tracks = plist.get("Tracks", {})# 遍历迭代for track_id, track in tracks.items():try:track_names.add(track['Name'])except:# ignorepass# 添加到track_name_sets中track_name_sets.append(track_names)# 交集处理common_tracks = set.intersection(*track_name_sets)# 写文件if len(common_tracks) > 0:f = open("common.txt", "w")for val in common_tracks:# s = "%s\n" % valf.write(f"{val}\n")f.close()print(f"Track names wirte to common.txt { len(common_tracks)}")else:print("No common tracks!")# 收集歌曲评分和时长
def plot_stats(file_name):# 读取播放列表with open(file_name, 'rb') as f:plist = plistlib.load(f)tracks = plist['Tracks']# 创建音轨排序和时长ratings = []durations = []for track_id, track in tracks.items():try:ratings.append(track['Album Rating'])durations.append(track['Total Time'])except:# ignorepass# 确保是有效数据if ratings == [] or durations == []:print(f"在文件中%s没有有效的Album Rating/Total Time  数据 {file_name}")return# scatter plot x= np.array(durations, np.int32) # convert to minutes x = x/60000.0 y = np.array(ratings, np.int32) pyplot.subplot(2, 1, 1) pyplot.plot(x, y, 'o') pyplot.axis([0, 1.05*np.max(x), -1, 110]) pyplot.xlabel('Track duration') pyplot.ylabel('Track rating') # plot histogram pyplot.subplot(2, 1, 2) pyplot.hist(x, bins=20) pyplot.xlabel('Track duration') pyplot.ylabel('Count') # show plot pyplot.show() def main():# create parserdescStr = """This program analyzes playlist files (.xml) exported from iTunes."""parser = argparse.ArgumentParser(description=descStr)# add a mutually exclusive group of argumentsgroup = parser.add_mutually_exclusive_group()# add expected argumentsgroup.add_argument('--common', nargs = '*', dest='plFiles', required=False)group.add_argument('--stats', dest='plFile', required=False)group.add_argument('--dup', dest='plFileD', required=False)# parse argsargs = parser.parse_args()if args.plFiles:# find common tracksfind_common_tracks(args.plFiles)elif args.plFile:# plot statsplot_stats(args.plFile)elif args.plFileD:# find duplicate tracksfind_duplicates(args.plFileD)else:print("These are not the tracks you are looking for.")if __name__ == "__main__":main()

最后这个是画图的部分,以后有兴趣再研究吧
在这里插入图片描述

http://www.dtcms.com/a/284813.html

相关文章:

  • 使用CosyVoice-300M实现零样本语音克隆:Xinference部署与实战
  • nginx代理websocket请求
  • Android设备标识符详解:IMEI、ANDROID_ID与OAID
  • 产品经理如何绘制服务蓝图(Service Blueprint)
  • 企业级AI智能体架构落地:工程化能力设计的全景指南
  • docker重新搭建redis集群
  • ubuntu系统+N卡 | docker compose+ollama+dify
  • ACOUSLIC-AI挑战报告:基于低收入国家盲扫超声数据的胎儿腹围测量|文献速递-医学影像算法文献分享
  • 【LeetCode刷题指南】--数组串联,合并两个有序数组,删除有序数组中的重复项
  • FreeBSD Conda Python3.12下安装GPT4Free(g4f)0.5.7.3版本
  • VR全景园区:开启智慧园区新时代
  • 2025年5大国产ETL工具横向评测
  • 【面板数据】上市公司股价同步性数据集-dta+xlsx(2000-2023年)
  • GX75C数字温度传感器可兼容TMP75C
  • 上标下标 | Unicode 符号
  • 微服务架构:从单体到分布式系统的演进与实践
  • 32位 DMIC 数据 其中高八位为符号位扩展位的理解
  • git merge-base查看某个分支从哪里拉出来的、主main分支上的某个时间之后某人的提交合并到特定分支(使用 cherry-pick 的场景)
  • 研发知识系统选型实战:从 Notion 到 Gitee Wiki 的迭代经验
  • Python中with的作用和用法
  • 前端之HTML学习
  • Python可迭代对象与迭代器详解 - 深入理解Python迭代机制
  • DolphinScheduler 如何高效调度 AnalyticDB on Spark 作业?
  • 【C语言】动态内存管理全解析:malloc、calloc、realloc与free的正确使用
  • AR技术赋能石化巡检:安全高效新引擎
  • linux-SSH
  • 2025年广东食品生产高级证考试题
  • Python特殊方法完全指南 | 掌握魔术方法提升编程能力
  • 性能监控(一)性能监控核心概念、核心指标
  • SGMD辛几何模态分解 直接替换Excel运行包含频谱图相关系数图 Matlab语言!