当前位置：首页 > news >正文

PDX列式存储

news 2025/8/21 12:15:25

向量数据示例
在这里插入图片描述

传统顺序（水平）存储
在这里插入图片描述

向量列式存储
在这里插入图片描述

向量列存

在这里插入图片描述

1. 水平方向（Horizontal）的流程与含义

核心思想：单条查询向量 vs. 多个数据维度（单指令多数据，SIMD）

适用场景：计算一条查询向量（如 Vector₀）与一个数据向量（如 D₀-D₇）的所有维度之间的距离。
并行粒度：在单个数据向量的不同维度上并行计算（如同时计算 D₀、D₁、D₂…的距离部分）。
步骤解析：

D₀-D₇：数据向量的 8 个维度（或 8 个数据点）。
Query Vector₀：需要匹配的目标查询向量。
load(1), load(2)：分批次加载数据（如先加载 D₀-D₃，再加载 D₄-D₇）。
fmadd(1)：计算load里面加载第一维度的数据平方再加上第五维度的平方，就是先计算乘积，再计算和。如（(Query - D₀)²+(Query - $D_5$ )²）。
SIMD result register：存储中间结果。
SIMD reduce：对部分距离结果求和（如 D₀² + D₁² + … + D₇²），得到最终距离。

V₀ distance：查询向量与当前数据向量的完整距离。

2. 垂直方向（Vertical）的流程与含义

核心思想：单个维度 vs. 多条数据向量（批量处理）

适用场景：计算查询向量的某一个维度（如 Dim₀）与多条数据向量的同一维度的距离部分。
并行粒度：在多个数据向量的同一维度上并行计算（如同时计算 100 条向量的 D₀ 维度）。

步骤解析：

D₀：所有数据向量的第 0 个维度（如 100 条向量的“颜色”维度）。
Query Dim₀：查询向量的第 0 个维度被广播（复制到所有处理单元）。
load (重复操作)：加载多条数据向量的 D₀ 值（如 Vector₁-D₀, Vector₂-D₀…）。
fmadd(d)：计算查询维度与所有数据向量 D₀ 的差值（如 (Query-D₀)²）。
SIMD result registers：存储部分距离结果（每条向量的 D₀ 部分结果）。
Partial Distances at D₀：当前维度的中间结果，后续需与其他维度累加。

关键点：

一次处理一个维度 vs. 多条数据向量。

适合批量查询（如数据库中对 100 条数据同时计算相似度）。

http://www.dtcms.com/a/133905.html

相关文章：

HarmonyOS 5 开发环境全解析：从搭建到实战

鹰角：EMR Serverless Spark 在《明日方舟》游戏业务的应用

2025年4月15日百度一面面经

MongoDB入门与安装指南

递归查询的应用

Python自动化处理奖金分摊：基于连续空值的智能分配算法升级

树莓派超全系列教程文档--(26)在 Raspberry Pi 上配置热点

html页面打开后中文乱码

【树莓派Pico FreeRTOS】-事件标志(Event Flags)与事件组(Event Groups)

【SpringBoot】深入解析自定义拦截器、注册配置拦截器、拦截路径方法及常见拦截路径、排除拦截路径、拦截器的执行流程

通过人类和机器人演示进行联合逆向和正向动力学的机器人训练

开源智慧巡检——无人机油田AI视频监控的未来之力

科普：想想神经网络是参数模型还是非参数模型

首次打蓝桥杯总结(c/c++B组)

无人机的群体协同与集群控制技术要点！

DIB：Drone in Box- 室内外场景无人机无人化自主巡检技术方案

FPAG IP核调用小练习

无人机自主导航与路径规划技术要点！

6.DJI-PSDK：psdk订阅无人机高度/速度/GPS/RTK/时间/经纬度等消息及问题解决

Playwright与Selenium详细对比及Playwright快速入门

Hadoop：大数据时代的基石

A008-Web 功能测试 – 咪咕音乐UI自动化，selenium

uniapp的通用页面及组件基本封装

公司内部自建知识共享的方式分类、详细步骤及表格总结，分为开源（对外公开）和闭源（仅限内部），以及公共（全员可访问）和内部（特定团队/项目组）四个维度

Android四大组件

视频分析设备平台EasyCVR安防视频管理系统，打造电石生产智能视频监控新体系

docker安装ES

AIDL 语言简介

Node.js入门

从大模型到AI基础设施，商汤的反向求解