当前位置: 首页 > news >正文

day 24

元组和OS模块

元组

元组的特点:

1. 有序,可以重复,这一点和列表一样

2. 元组中的元素不能修改,这一点非常重要,深度学习场景中很多参数、形状定义好了确保后续不能被修改。

元组的创建

my_tuple1 = (1, 2, 3)
my_tuple2 = ('a', 'b', 'c')
my_tuple3 = (1, 'hello', 3.14, [4, 5]) # 可以包含不同类型的元素
print(my_tuple1)
print(my_tuple2)
print(my_tuple3)
# 可以省略括号
my_tuple4 = 10, 20, 'thirty' # 逗号是关键
print(my_tuple4)
print(type(my_tuple4)) # 看看它的类型

元组的常见用法

# 元组的索引
my_tuple = ('P', 'y', 't', 'h', 'o', 'n')
print(my_tuple[0])  # 第一个元素
print(my_tuple[2])  # 第三个元素
print(my_tuple[-1]) # 最后一个元素
# 元组的切片
my_tuple = (0, 1, 2, 3, 4, 5)
print(my_tuple[1:4])  # 从索引 1 到 3 (不包括 4)
print(my_tuple[:3])   # 从开头到索引 2
print(my_tuple[3:])   # 从索引 3 到结尾
print(my_tuple[::2])  # 每隔一个元素取一个
# 元组的长度获取
my_tuple = (1, 2, 3)
print(len(my_tuple))

管道工程中pipeline类接收的是一个包含多个小元组的 列表 作为输入。

可以这样理解这个结构:

1. 列表 []: 定义了步骤执行的先后顺序。Pipeline 会按照列表中的顺序依次处理数据。之所以用列表,是未来可以对这个列表进行修改。

2. 元组 (): 用于将每个步骤的名称和处理对象捆绑在一起。名称用于在后续访问或设置参数时引用该步骤,而对象则是实际执行数据转换或模型训练的工具。固定了操作名+操作

OS 模块

获取当前工作目录

os.getcwd() # get current working directory 获取当前工作目录的绝对路径

获取当前工作目录下的文件列表

os.listdir() # list directory 获取当前工作目录下的文件列表

#    我们使用 r'' 原始字符串,这样就不需要写双反斜杠 \\,因为\会涉及到转义问题
path_a = r'C:\Users\YourUsername\Documents' # r''这个写法是写给python解释器看,他只会读取引号内的内容,不用在意r的存在会不会影响拼接
path_b = 'MyProjectData'
file = 'results.csv'# 使用 os.path.join 将它们安全地拼接起来,os.path.join 会自动使用 Windows 的反斜杠 '\' 作为分隔符
file_path = os.path.join(path_a , path_b, file)file_path

目录树

os.walk() 是 Python os 模块中一个非常有用的函数,它用于遍历(或称“行走”)一个目录树。

核心功能:

os.walk(top, topdown=True, οnerrοr=None, followlinks=False) 会为一个目录树生成文件名。对于树中的每个目录(包括 top 目录本身),它会 yield(产生)一个包含三个元素的元组 (tuple):

(dirpath, dirnames, filenames)

1. dirpath: 一个字符串,表示当前正在访问的目录的路径。

2. dirnames: 一个列表(list),包含了 dirpath 目录下所有子目录的名称(不包括 . 和 ..)。

3. filenames: 一个列表(list),包含了 dirpath 目录下所有非目录文件的名称。

遍历顺序:

`os.walk` 会首先访问起始目录 (`my_project`),然后它会选择第一个子目录 (`data`) 并深入进去,访问 `data` 目录本身,然后继续深入它的子目录 (`processed` -> `raw`)。只有当 `data` 分支下的所有内容都被访问完毕后,它才会回到 `my_project` 这一层,去访问下一个子目录 (`src`),并对 `src` 分支重复深度优先的探索。

它不是按层级(先访问所有第一层,再访问所有第二层)进行的,而是按分支深度进行的。这种策略被称之为深度优先

import osstart_directory = os.getcwd() # 假设这个目录在当前工作目录下print(f"--- 开始遍历目录: {start_directory} ---")for dirpath, dirnames, filenames in os.walk(start_directory):print(f"  当前访问目录 (dirpath): {dirpath}")print(f"  子目录列表 (dirnames): {dirnames}")print(f"  文件列表 (filenames): {filenames}")

@浙大疏锦行

相关文章:

  • 闭包原理与常见陷阱
  • WSL 安装 Debian 12 后,Linux 如何安装 nginx ?
  • HarmonyOS 【诗韵悠然】AI古诗词赏析APP开发实战从零到一系列(二、项目准备与后台服务搭建)
  • linux操作系统命令
  • 《量子语言模型研究综述》核心解读
  • Axure应用交互设计:表格跟随菜单移动效果(超长表单)
  • 【JavaScript】JavaScript实现大数相乘
  • RDD的自定义分区器
  • 运行Spark程序-在shell中运行
  • 【Ubuntu】neovim Lazyvim安装与卸载
  • 网络状态可以通过hutool.HttpStatus获取
  • 讯联云库项目开发日志(一)
  • 3.2 一点一世界
  • 嵌入式学习笔记 - HAL_ADC_ConfigChannel函数解析
  • 出于PCB设计层面考虑,连排半孔需要注意哪些事项?
  • 构建媲美 ChatGPT 的 AI 交互界面—OpenWebUI
  • Flannel UDP 模式的优缺点
  • WebRTC技术EasyRTC嵌入式音视频通信SDK打造远程实时视频通话监控巡检解决方案
  • JPG与PDF格式转换器
  • 06 mysql之DML
  • 广东省中医院脾胃病科大科主任张北平病逝,年仅52岁
  • 上海团队在医学顶刊连发两文,率先提出“证据污染”循证概念
  • 首映|奥斯卡最佳国际影片《我仍在此》即将公映
  • 排污染黑海水后用沙土覆盖黑泥?汕尾环保部门:非欲盖弥彰
  • 旭辉控股集团主席林中:债务重组是活下来的前提,自营开发业务收缩至少数核心城市
  • “降息潮”延续,多家民营银行下调存款利率