当前位置: 首页 > wzjs >正文

网站怎么修改模板内容济南seo整站优化招商电话

网站怎么修改模板内容,济南seo整站优化招商电话,做微信的网站有哪些,柏乡县网站建设1.组件说明 该组件提供了一个可视化、交互式的数据质量规则设计器,支持多种校验类型和参数配置,便于灵活定义和管理数据校验逻辑。 适用于需要灵活配置数据质量校验规则的场景,在数据从数据源抽取、转换并加载到数据仓库的ETL过程中&#x…

1.组件说明

该组件提供了一个可视化、交互式的数据质量规则设计器,支持多种校验类型和参数配置,便于灵活定义和管理数据校验逻辑。

适用于需要灵活配置数据质量校验规则的场景,在数据从数据源抽取、转换并加载到数据仓库的ETL过程中,添加数据质量检查组件,对每一步的数据进行质量检查。例如,在数据抽取后检查数据的完整性,在转换过程中检查数据的一致性和准确性,确保只有符合质量要求的数据才能进入数据仓库,避免错误数据对后续数据分析和决策的影响。

2.组件主要功能

  1. 规则级别与描述设置

    • 支持选择校验级别(错误/Error 或 警告/Warning)。
    • 支持输入规则描述。
  2. 约束条件管理

    • 支持添加、删除多个约束条件。
    • 每个约束可选择不同的校验类型(如:数据集大小、列完整性、唯一性、主键检查、非负值、最小/最大/平均值、模式匹配、自定义条件等)。
    • 根据不同类型动态渲染所需的参数输入项(如列名、操作符、期望值、区间、允许的值、自定义表达式等)。
    • 支持操作符选择(如等于、不等于、大于、小于、区间等),部分类型支持区间输入。
    校验类型 val说明适用场景与含义
    hasSize数据集大小校验数据集的总行数是否满足指定条件(如等于/大于/小于某个值或在某个区间内)。
    isComplete列完整性校验指定列是否不存在空值(即该列所有行都必须有值)。
    isUnique列唯一性校验指定列的值是否唯一(即该列不能有重复值)。
    isPrimaryKey主键检查校验指定列是否为主键(通常要求唯一且非空)。
    isContainedIn值在集合中校验指定列的值是否都包含在给定的值集合内。
    isNonNegative非负值校验指定列的所有值是否都大于等于 0。
    hasPattern模式匹配校验指定列的值是否都符合某种正则表达式模式(如手机号、邮箱等格式校验)。
    satisfies自定义条件支持自定义表达式校验,如“column1 > column2”等复杂逻辑。
    hasMin最小值校验指定列的最小值是否满足条件(如大于/小于/等于某个值或在区间内)。
    hasMax最大值校验指定列的最大值是否满足条件(如大于/小于/等于某个值或在区间内)。
    hasMean平均值校验指定列的平均值是否满足条件(如大于/小于/等于某个值或在区间内)。

    说明:

    • 部分类型(如 hasSize、hasMin、hasMax、hasMean)支持操作符选择(等于、不等于、大于、小于、区间等)。
    • isContainedIn 需要填写允许的值集合。
    • satisfies 需要填写自定义表达式和条件名称。
    • 其他类型通常需要指定列名。

3. 组件演示

3.1 创建任务

  • 入口:通过顶部菜单栏选择 任务开发,或通过快捷入口 快速创建任务

  • 任务类型:选择 SparkPipeline

3.2 配置任务

点击任务名称,进入任务详情页。任务节点如下

使用MockData节点生成100条测试数据

  • id列类型为STRING,不为空

  • age列类型为INT,可为空

在这里插入图片描述

使用DataProfiling探索数据

使用Deequ进行数据质量检查

规则定义如下:

  • 数据集大小在10到100之间

  • id列不能为空

  • age列值唯一

  • age列值最小值在10 - 20之间

  • age列最大值小于等于100

  • age列非负数

  • id列为主键列

在这里插入图片描述
在这里插入图片描述

最后通过TableShow对各节点结果可视化展示

3.3 结果查看

模拟数据结果:

可自定义图表对结果进行可视化

在这里插入图片描述

数据探查结果:

在这里插入图片描述

数据质量检测结果:

从探查结果可见:

age列最小值为3,最大值为97,规则age列值最小值在10 - 20不通过,规则age列最大值小于等于100通过。

🔗 平台体验地址:DataStudio (http://1.94.182.15:8090)

Spark流水线数据质量检查

http://www.dtcms.com/wzjs/59333.html

相关文章:

  • 手机网站自助建站seo外包服务方案
  • 做视频网站 服务器配置百度指数下载
  • 开发一个软件的流程是什么网站排名优化怎样做
  • 正规网站建设定制怎样把自己的产品放到网上销售
  • django网站开发实例pdf如何学会推广和营销
  • 网站实名制 怎么做seo的中文含义是什么
  • 小程序项目信息流优化师发展前景
  • 自己创业网站开发发软文的平台
  • 乐山市建设银行网站佛山百度网站快速排名
  • 交友小程序源码连云港seo公司
  • 徐州市建设工程质监站网站百度竞价推广代运营
  • 矢量网站动画怎么做新闻稿代写
  • 中网互联网站建设域名在线查询
  • 博物馆建设网站有什么好处青岛百度seo代理
  • 服装网站建设费用分析徐州关键词优化平台
  • 怎么利用婚庆网站做营销独立站建站平台
  • 小米路由做网站百度关键词热度排名
  • 平凉网站建设网站流量查询服务平台
  • 如何做网站实现收入稳定友情链接有哪些
  • 做热处理工艺的网站有哪些晋江怎么交换友情链接
  • 众云网联做的网站效果好吗郑州网站制作推广公司
  • c web网站开发 pdf今日头条郑州头条新闻
  • 阿里云部署一个自己做的网站吗软文世界官网
  • 邢台哪儿专业做网站产品软文范例软文
  • 做外贸的网站有哪些中国楼市最新消息
  • 河南省建设教育协会网站零基础学什么技术好
  • 哪个网站用织梦做的百度收录入口在哪里
  • 网站建设怎么做上海网站建设seo
  • 网站集约化建设情况汇报营销方案策划
  • 电商网站建设模型图站长统计app