当前位置: 首页 > news >正文

Python 库 petrel_client.client 浅入浅出

petrel_client.client 是用于访问和操作 Petrel 对象存储服务的 Python 客户端库。Petrel 是由阿里云推出的高性能分布式对象存储系统,支持海量数据存储和高并发访问。该库提供了简洁的 API,用于文件的上传、下载、删除、元数据查询等操作,适用于数据处理、机器学习、分布式计算等场景。

基本功能

  1. 初始化客户端:通过配置访问凭证和 endpoint 连接到 Petrel 服务。
  2. 文件操作:支持上传、下载、删除、检查文件是否存在等。
  3. 目录操作:支持创建、列出目录内容等。
  4. 元数据管理:获取和设置文件元数据。
  5. 批量操作:支持批量上传或下载文件。

安装

pip install petrel_client

使用示例

下面是 petrel_client.client 的一些常见用法示例:

from petrel_client.client import Client# 初始化客户端(方式一:配置文件)
# 配置文件路径默认为 ~/.petreloss.conf,也可通过环境变量 PETREL_CONFIG_PATH 指定
client = Client()# 初始化客户端(方式二:直接传入配置)
client = Client(conf={'fs.petrel.access.key.id': 'your_access_key_id','fs.petrel.access.key.secret': 'your_access_key_secret','fs.petrel.endpoint': 'petrel_endpoint',
})# 检查客户端是否初始化成功
if not client.initialized():print("客户端初始化失败")exit(1)# 上传文件
local_path = 'local_file.txt'
petrel_path = 'oss://your-bucket/path/to/remote_file.txt'
client.put(local_path, petrel_path)
print(f"文件 {local_path} 已上传至 {petrel_path}")# 下载文件
download_path = 'downloaded_file.txt'
client.get(petrel_path, download_path)
print(f"文件 {petrel_path} 已下载至 {download_path}")# 检查文件是否存在
exists = client.exists(petrel_path)
print(f"文件 {petrel_path} 是否存在: {exists}")# 获取文件元数据
metadata = client.head(petrel_path)
print(f"文件 {petrel_path} 的元数据: {metadata}")# 列出目录内容
directory = 'oss://your-bucket/path/to/directory/'
objects = client.list(directory)
print(f"目录 {directory} 中的内容:")
for obj in objects:print(f"- {obj}")# 删除文件
client.delete(petrel_path)
print(f"文件 {petrel_path} 已删除")# 批量上传多个文件
file_mapping = {'local_file1.txt': 'oss://your-bucket/path/to/file1.txt','local_file2.txt': 'oss://your-bucket/path/to/file2.txt',
}
client.put_multiple(file_mapping)
print("批量上传完成")# 批量下载多个文件
download_mapping = {'oss://your-bucket/path/to/file1.txt': 'downloaded1.txt','oss://your-bucket/path/to/file2.txt': 'downloaded2.txt',
}
client.get_multiple(download_mapping)
print("批量下载完成")

配置文件示例

如果你选择使用配置文件方式初始化客户端,~/.petreloss.conf 文件的示例内容如下:

[default]
fs.petrel.access.key.id = your_access_key_id
fs.petrel.access.key.secret = your_access_key_secret
fs.petrel.endpoint = petrel_endpoint

注意事项

  • Petrel 路径格式为 oss://bucket-name/path/to/object
  • 对于大规模数据处理,建议使用批量操作以提高效率。

相关文章:

  • Python爬虫(17)反爬攻防战:随机请求头实战指南(fake_useragent库深度解析)
  • python:如何计算皮尔森相关系数
  • 商场防损部绩效考核制度与管理方法
  • Spring MVC常见注解详解
  • JAVA组织/岗位拉取多段时间属性到一张表上时,时间段分隔问题
  • C语言 指针(5)
  • 不定长滑动窗口(求最短/最小)
  • 【quantity】11 体积单位模块(volume.rs)
  • Kubernetes(k8s)学习笔记(五)--部署Ingress实现域名访问和负载均衡
  • C++23 std::tuple与其他元组式对象的兼容 (P2165R4)
  • 每天五分钟深度学习框架PyTorch:基于Dataset封装自定义数据集
  • 用哈希表封装出unordered_set/_map
  • MySQL基础关键_007_DQL 练习
  • MOS管极间电容参数学习
  • 华中科技大学系统结构慕课部分答案
  • 250504_VsCode使用
  • Mybatis执行流程知多少
  • WEB 前端学 JAVA(二)Java 的发展与技术图谱简介
  • Linux网络编程:套接字
  • Spring AI支持的聊天模型全方位比较与分析
  • 今晚上海地铁1、2、10、17号线加开定点班车至次日0点
  • 专访|刘伟强:在《水饺皇后》里,我放进儿时全家福照片
  • 五一假期首日,省级党政“一把手”夜访商业街区
  • 韩国前国务总理韩德洙正式宣布参加总统选举
  • 韩国经济副总理崔相穆宣布辞职
  • “五一”假期首日迎出游高峰:火车站人流“堪比春运”,热门景区门票预订量同比增三成