当前位置：首页 > news >正文

怎样用 esProc 将数据集中重复内容置空

news 2025/10/31 18:52:55

某库表的前两个字段会同时出现重复值，比如下面的前 3 条记录。

Column_A	Column_B	Column_C
1	AB	amount1
1	AB	amount2
1	AB	amount3
2	OA	amount4
3	OE	amount5
3	OE	amount6
4	DB	amount7

现在要将所有的重复值改成 null，换句话说，按前 2 个字段分组后（等价于按其中 1 个字段分组），只保留组内第一条不变，其他记录的前两个字段改成 null。

计算结果像下面这样：

Column_A	Column_B	Column_C
1	AB	amount1
		amount2
		amount3
2	OA	amount4
3	OE	amount5
		amount6
4	DB	amount7

SQL分组后必须立刻汇总，不能保持分组子集继续计算，也没有天然的组内行号，代码比较难写。

esProc提供了丰富的计算函数，可以保持分组子集继续计算，有天然的行号，包括组内行号：esProc Web Try

	A
1	$select * from table_name.txt
2	=A1.group(Column_A)
3	=A2.run(~.(if(#!=1,Column_A=Column_B=null)))
4	=A3.conj()

A1：加载数据。

A2：用 group 函数按第 1 个字段分组，但不汇总。

Picture1png

每组是一个集合，可以通过点击展开，如图是前两组。

Picture2png

A2：用 run 函数修改各组数据，当成员在组内的序号大于 1 时，将前两个字段改为 null。~ 表示当前组，# 表示组内序号。

Picture3png

A3：合并各组。

Picture4png

上面分步骤的代码有利于学习和调试，熟练后 A2-A4 可以合为一句：

=A1.group(Column_A).run(~.(if(#!=1,Column_A=Column_B=null))).conj()

esProc是开源免费的，下载试用~

查看全文

http://www.dtcms.com/a/145918.html

.NET WPF 三维模型

蓝桥杯 16.对局匹配

GPU高效利用率实战揭秘：蓝耘元生代VS传统云平台的降维打击

解析三大中间件：Nginx、Apache与Tomcat

AOSP Android14 Launcher3——远程窗口动画关键类SurfaceControl详解

Unreal 如何实现一个Vehicle汽车沿着一条指定Spline路径自动驾驶

应用层核心协议详解：HTTP, HTTPS, RPC 与 Nginx

StarRocks：一款开源的高性能分析型数据仓库

C#常用LINQ

ubuntu学习day4

ubuntu--安装双系统

规则引擎 - Easy Rules

Spark和Hadoop的区别和联系

【AI提示词】数据分析专家

系统安全及应用

一个关于相对速度的假想的故事-3

Linux 入门十一：Linux 网络编程

PyCharm 在 Linux 上的完整安装与使用指南

arxml文件中的schema是什么？有什么作用？

Kafka 在小流量和大流量场景下的顺序消费问题

typedef MVS_API CLISTDEF0IDX(ViewScore, IIndex) ViewScoreArr；

Vue3 源码解析（六）：响应式原理与 reactive

DePIN驱动的分布式AI资源网络

Python 爬虫如何获取淘宝商品的 SKU 详细信息

云服务器怎么选择防御最合适

深度学习中的归一化技术：从原理到实战全解析

使用 Logstash 迁移 MongoDB 数据到 Easysearch

C语言中联合体(Union)和结构体(Struct)的嵌套用法

Unity打开项目时目标平台被改变

新能源汽车充电桩运营模式的发展与优化路径探析

相关文章：