当前位置: 首页 > news >正文

深度学习中的数据类型

1. NumPy 数组 (numpy.ndarray)

  • 核心定位:科学计算的基础工具,处理数值多维数组

  • 特点

    • 高效数值运算:底层用 C 实现,适合数学计算(如矩阵乘法、傅里叶变换)。

    • 内存连续存储:数据在内存中连续排列,优化计算速度。

    • 维度灵活:支持从 0 维(标量)到 N 维数组。

  • 典型场景

    • 数学计算(如线性代数、随机数生成)。

    • 图像、音频等多维数据处理。

    • 与其他库(如 Pandas、深度学习框架)交互的中间格式。

2. Pandas  (DataFrame/Series)

  • 核心定位表格数据时间序列处理,适合数据清洗、分析和统计。

  • 特点

    • 表格结构DataFrame 是二维表格(行+列),Series 是单列数据。

    • 标签索引:支持用列名(columns)和行索引(index)快速定位数据。

    • 缺失值处理:自动处理 NaN(如填充、删除)。

    • 时间序列支持:内置日期范围生成、重采样等功能。

  • 典型场景

    • 数据清洗(如处理缺失值、去重)。

    • 统计分析(如分组聚合、透视表)。

    • 从 CSV/Excel 读取数据并预处理。

3. Tensor(PyTorch/TensorFlow 张量)

  • 核心定位深度学习框架中的多维数组,支持 GPU 加速和自动微分。

  • 特点

    • GPU 加速:可在 GPU 上运行,大幅提升计算速度。

    • 自动微分:记录计算图,支持反向传播(如 tensor.backward())。

    • 动态/静态计算图:PyTorch 支持动态图,TensorFlow 早期静态图,现也支持动态。

    • 设备感知:数据可在 CPU 或 GPU 间迁移(如 tensor.to("cuda"))。

  • 典型场景

    • 构建和训练神经网络。

    • 需要 GPU 加速的大规模数值计算。

    • 实现自定义梯度下降或复杂模型。

相关文章:

  • 17-动规-最长增长子序列
  • leetcode90-子集II
  • 我的编程之旅:从零到无限可能
  • 剖析 Redis 缓存更新策略:保障数据一致性与系统性能的平衡
  • 光传输设备现状
  • 刷题日记day14-字符串-数组去重和排序
  • flutter 专题 七十四 Flutter开发之动画
  • 【Docker镜像】Python项目之使用Dockerfile构建镜像(二)
  • 在Trae中设置Python解释器版本
  • 从零实现3D自动标注:MS3D、MS3D++
  • Android 项目问题:The specified Android SDK Build Tools version (28.0.3) is ignored
  • 【SMBIOS数据块类型列表】
  • 精心整理-2024最新网络安全-信息安全全套资料(学习路线、教程笔记、工具软件、面试文档).zip
  • SQL Server:当在删除数据库时因为存在触发器而无法删除
  • 中小型企业网络的搭建
  • c++学习系列----006. c++模板(函数模板)
  • 静态网页应用开发环境搭建实战教程
  • Manim 输出视频尺寸设置
  • CD20.【C++ Dev】类和对象(11) 日期类对象的成员函数(++、--、日期-日期)
  • C++:allocator类(动态数组续)
  • 李开复出任福耀科技大学理事会理事,助力学校AI战略
  • 中国科学院院士张泽民已任重庆医科大学校长
  • 锦江酒店:第一季度营业收入约29.42亿元,境内酒店出租率同比增长
  • 中国建设银行浙江省分行原党委书记、行长高强接受审查调查
  • 神舟十九号载人飞船因东风着陆场气象原因推迟返回
  • 打造全域消费场景,上海大世界百个演艺娱乐新物种待孵化