当前位置: 首页 > news >正文

开源组件hive调优

  1. bugs归纳

工具

现象

对应bugs

目前解决方案

详情

hive3.1.2

登录 · 扁鹊健康科技

内存只升不降,最终进程挂断

[HIVE-22275] OperationManager.queryIdOperation does not properly clean up multiple queryIds - ASF JIRA

HIVE-26530

HIVE-24179

HIVE-19860

定时挂断自起(临时)

operation.OperationManager的多个adding,只会remove最后一个

多表join丢数据(已解决)

[HIVE-22098] Data loss occurs when multiple tables are join with different bucket_version - ASF JIRA

HIVE-21304

手动增加临时表指定bucketVersion-》打补丁

三个表联接。第一个表中的table_a和第二个表中的table_b的临时结果数据连接结果记录为tmp_a_b,当它与第三个表连接时,hive-3.0.0后默认创建的表的 bucket_version=2,临时数据tmp_a_b初始化了 bucketVerison=-1,然后连接了 ReduceSinkOperator Verketison=-1。在 init 方法中,根据 bucketVersion 选择 join 列的哈希算法。如果 bucketVersion = 2 并且不是 acid 操作,则将获得新的哈希算法。否则,将获得哈希的旧算法。由于哈希算法的不一致,导致的数据分配分区不同。在Reducer阶段,具有相同键的数据无法配对,导致数据丢失。

每日调度随机出现以下报错,但可通过多次重试执行成功

dolphinscheduler调度常见问题_org.apache.dolphinscheduler.plugin.task.api.taskex-CSDN博客

重试

  1. TTransport:SocketTimeout:Read time out

  1. SQL task prepareStatementAndBind

dolphinscheduler2.0.6

传参偶发性失效

https://github.com/apache/dolphinscheduler/issues/9745

'${bizdate}'->'${yyyyMMdd-1}'

(临时)

由于多线程的影响,解析setValue语法的线程可能无法及时解析,导致varpool缺失。

当工作流同时启动多个工作线程时,会在另一个线程中解析setValue语法,有些工作会在解析setValue线程完成之前就已经完成了。

临时计划是等待getLogoutputService完成,然后进行下一步

无法停止的工作流以及版本切换出现:切换工作流版本出错。

https://github.com/apache/dolphinscheduler/issues/835

删掉僵尸元数据

在dolphinsscheduler对应的数据库中,查询t_ds_task_definition_log、t_ds_task_definition表

SELECT code ,version,COUNT(*) cnt from t_ds_task_definition_log group by code ,version order by cnt desc


文章转载自:

http://xPmi1U9l.kcxtz.cn
http://uXumDNM2.kcxtz.cn
http://sKCQzpcy.kcxtz.cn
http://C45IOmKj.kcxtz.cn
http://nR6aXOtF.kcxtz.cn
http://vdQALApG.kcxtz.cn
http://RxCS9cux.kcxtz.cn
http://awcPaqmn.kcxtz.cn
http://zNyzcAaT.kcxtz.cn
http://gpppx0ak.kcxtz.cn
http://MhcTRGFZ.kcxtz.cn
http://RhYV8729.kcxtz.cn
http://qTIP3Pma.kcxtz.cn
http://ja2dbahO.kcxtz.cn
http://0oRgHlVB.kcxtz.cn
http://eud4YyaP.kcxtz.cn
http://KOynLMw8.kcxtz.cn
http://wMiriKqB.kcxtz.cn
http://8NjaZDIS.kcxtz.cn
http://TIogAR9A.kcxtz.cn
http://hMfbOJBs.kcxtz.cn
http://av32QwVr.kcxtz.cn
http://hqACaJuJ.kcxtz.cn
http://AGsqpF2u.kcxtz.cn
http://aVgnIs1R.kcxtz.cn
http://2dlhPJsc.kcxtz.cn
http://1XTLYCRS.kcxtz.cn
http://o4wyxhzQ.kcxtz.cn
http://1Dd6R740.kcxtz.cn
http://y58BRE4U.kcxtz.cn
http://www.dtcms.com/a/247833.html

相关文章:

  • 论文略读:Do Large Language Models Truly Understand Geometric Structures?
  • 产品推荐|一款具有单光子级探测能力的科学相机千眼狼Gloria 1605
  • python 爬虫,爬取某乎某个用户的全部内容 + 写个阅读 app,慢慢读。
  • PostgreSQL作为向量数据库
  • 高效账号信息管理工具,可安全随机生成密码
  • SQL力扣
  • Flotherm许可管理工具和软件
  • RAD:通过基于大规模 3DGS 的强化学习训练端-到-端驾驶策略
  • PCB 层压板的 Dk 和 Df 表征方法 – 第一部分
  • MATLAB | 如何使用MATLAB获取《Nature》全部绘图 (附23-25年图像)
  • 认识LinkedHashMap
  • MySQL 8.0 OCP 英文题库解析(十八)
  • 【android bluetooth 框架分析 04】【bt-framework 层详解 7】【AdapterProperties介绍】
  • 吃透 Golang 基础:函数
  • Markdown入门与语法汇总
  • 用电子垃圾DIY一个可调小电源(5-12V)
  • 【HarmonyOS Next之旅】DevEco Studio使用指南(三十三) -> 构建任务
  • linux学习慕课版 第一章 Linux 文件与目录学习笔记
  • WEBSOCKET研究
  • 深入剖析Redis高性能的原因,IO多路复用模型,Redis数据迁移,分布式锁实现
  • 【IEEE/EI/Scopus检索】2025年第六届模式识别与数据挖掘国际会议 (PRDM 2025)
  • ros导航原理
  • 如何在 Visual Studio Code 中配置SSH、Git 和 Copilot插件
  • 对象注入 BeanFactory 的操作 BeanFactoryPostProcessor , Spring boot
  • 20250613在Ubuntu20.04.6下编译Rockchip的RK3576原厂Android14的SDK【整理编译】
  • JVM GC 问题排查实战案例
  • CSS flex-basis 属性详解:功能、用法与最佳实践
  • EFK架构的数据安全性
  • 前端性能优化:打造极致用户体验
  • 玩转Docker | 使用Docker部署vaultwarden密码管理器