当前位置: 首页 > wzjs >正文

浙江网站建设流程爱站网关键词搜索

浙江网站建设流程,爱站网关键词搜索,做网站中怎么设置单张图片,莱芜在线招聘信息以下是基于Apache Doris的Ranger Hive审计日志同步方案详细步骤,结合审计日志插件与数据导入策略实现: 一、Doris环境准备 1. 创建审计日志库表 参考搜索结果的表结构设计,根据Ranger日志字段调整建表语句: CREATE DATABASE IF…

以下是基于Apache Doris的Ranger Hive审计日志同步方案详细步骤,结合审计日志插件与数据导入策略实现:


一、Doris环境准备

1. 创建审计日志库表

参考搜索结果的表结构设计,根据Ranger日志字段调整建表语句:

CREATE DATABASE IF NOT EXISTS ranger_audit;CREATE TABLE IF NOT EXISTS ranger_audit_hive_log (repoType INT COMMENT '仓库类型标识',repo VARCHAR(50) COMMENT '目标仓库名称',reqUser VARCHAR(50) COMMENT '请求用户',evtTime DATETIMEV2(3) COMMENT '事件时间(毫秒精度)',access VARCHAR(20) COMMENT '操作类型',resource VARCHAR(255) COMMENT '资源路径',resType VARCHAR(20) COMMENT '资源类型',action VARCHAR(20) COMMENT '具体动作',result TINYINT COMMENT '执行结果(0失败/1成功)',agent VARCHAR(50) COMMENT '代理服务类型',policy INT COMMENT '策略ID',enforcer VARCHAR(50) COMMENT '策略执行组件',sess VARCHAR(36) COMMENT '会话ID(UUID)',cliType VARCHAR(20) COMMENT '客户端类型',cliIP ipv4 COMMENT '客户端IP',reqData TEXT COMMENT '原始请求数据',agentHost VARCHAR(50) COMMENT '代理主机名',logType VARCHAR(20) DEFAULT 'RangerAudit' COMMENT '日志类型',id VARCHAR(50) COMMENT '唯一事件ID',seq_num INT COMMENT '序列号',event_count INT COMMENT '事件计数',event_dur_ms INT COMMENT '事件持续时间(ms)',tags ARRAY<VARCHAR(50)> COMMENT '标签数组',additional_info VARCHAR(500) COMMENT '扩展信息(结构化数据)',cluster_name VARCHAR(50) COMMENT '集群名称',policy_version INT COMMENT '策略版本'
)
ENGINE=OLAP
DUPLICATE KEY(repoType,repo,reqUser,evtTime)
COMMENT 'Ranger审计Hive日志存储表'
PARTITION BY RANGE(evtTime)()
DISTRIBUTED BY HASH(id) BUCKETS auto
PROPERTIES ("replication_num" = "3","dynamic_partition.enable" = "true","dynamic_partition.create_history_partition" = "true","dynamic_partition.time_unit" = "DAY","dynamic_partition.start" = "-180","dynamic_partition.end" = "7","dynamic_partition.prefix" = "p","dynamic_partition.buckets" = "8"
);

2. 启用审计日志插件

在Doris FE节点部署审计日志插件:

# 解压插件到FE插件目录
unzip auditloader.zip -d /opt/doris/fe/plugins/audit/
# 修改plugin.conf配置Ranger日志源
frontend_host_port = 192.168.1.101:8030  # Doris FE地址
database = ranger_audit
audit_log_table = log_main
user = sync_user  # 有写入权限的账户

三、日志传输与加载

1. Broker Load定时导入

创建每日定时任务加载HDFS上的审计日志:

LOAD LABEL broker_load_test_user111
(DATA INFILE("hdfs://ns01/ranger/audit/hiveServer2/20250318/hiveServer2_ranger_audit.log")INTO TABLE ranger_audit_hive_logFORMAT AS "json"
)
WITH HDFS
("fs.defaultFS" = "hdfs://ns01","hadoop.security.authentication" = "kerberos","hadoop.kerberos.principal" = "user01@HADOOP.COM","hadoop.kerberos.keytab" = "/etc/security/keytabs/user01.keytab","dfs.nameservices" = "ns01","dfs.ha.namenodes.ns01" = "nn1,nn2","dfs.namenode.rpc-address.ns01.nn1" = "192.168.1.101:8020","dfs.namenode.rpc-address.ns01.nn2" = "192.168.1.102:8020","dfs.client.failover.proxy.provider.ns01" = "org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider","hadoop.security.auth_to_local" = "RULE:[1:$1@$0](^.*@.*$)s/^(.*)@.*$/$1/gRULE:[2:$1@$0](^.*@.*$)s/^(.*)@.*$/$1/gDEFAULT"
)
PROPERTIES
("timeout" = "14400","max_filter_ratio" = "0.1","exec_mem_limit" = "2147483648","strict_mode" = "false","timezone" = "Asia/Shanghai","load_parallelism" = "1","send_batch_parallelism" = "1","load_to_single_tablet" = "false","priority" = "NORMAL"
)
COMMENT "备注、注释";

2. 脏数据处理

# 我这里additional_info 字段中不是一个正确的json串,所以建表类型用的是varchar
报错一:Reason: no partition for this tuple. tuple=
数据写入时,没有对应的分区报错二:Reason: column(additional_info) value is incorrect while strict mode is true, src value is
additional_info类型设置为varchar

四、运维监控与优化

  1. 数据质量校验
    -- 检查数据完整性,1000根据自身实际的审计日志数量调整
    SELECT DATE(evtTime) AS day, COUNT(*) FROM ranger_audit_hive_log
    GROUP BY day HAVING COUNT(*) < 1000;  # 阈值告警
    
  2. 查询加速
    为核心字段添加索引:
    ALTER TABLE log_main ADD INDEX idx_action (action) USING BITMAP;
    

五、安全加固

  1. 权限隔离
    按角色控制访问权限:

    -- 创建只读角色
    CREATE ROLE audit_viewer;
    GRANT Select_priv ON audit_log.* TO audit_viewer;
    
  2. 敏感字段脱敏
    通过Ranger策略对reqData字段动态脱敏:

    -- 在Ranger中配置策略
    Mask类型: Partial mask show last 4
    生效字段: reqData中的手机号(如`1*******5678`

六、故障处理指南

  1. 常见问题排查
    数据延迟:检查Broker Load任务状态 SHOW LOAD WHERE LABEL LIKE 'ranger%';
    格式错误:使用curl -X GET http://fe_host:8030/api/_load_error_log?file=__ranger_audit_log获取错误详情
    权限拒绝:验证用户权限 SHOW GRANTS FOR sync_user;

  2. 日志清理策略

    -- 调整保留周期为90天
    ALTER TABLE log_main SET ("dynamic_partition.start" = "-90");
    

通过以上步骤可实现Ranger审计日志从采集、传输到分析的全链路管理。实际部署时需根据集群规模调整分桶数和并发参数,并定期检查存储策略有效性。

http://www.dtcms.com/wzjs/334239.html

相关文章:

  • 西安网站设计方案seo自动推广工具
  • 安庆公司做网站培训计划模板
  • 深圳电商网站建设公司百度网页版登录首页
  • 开发网站开票写什么如何写推广软文
  • wordpress主题异次元软件世界北京seo费用是多少
  • 编辑网页用什么软件seo优化的内容有哪些
  • 自己切片做网站游戏推广怎么做挣钱
  • 在郑州做网站国内做网站的公司
  • 河北省企业信用信息查询公示系统四川seo
  • 一个做3dh视频的国外网站2345导航网址
  • 建站服务发票优化网站的目的
  • 挖金矿游戏网站建设热点新闻事件及观点
  • 手机微信网站怎么做的北京企业网站seo平台
  • 不关闭网站 备案台州网站建设
  • 那家网站做照片书好seo入门
  • 个人网站怎么设计网络营销推广的目的
  • 日本做家纺的公司网站目前搜索引擎排名
  • 网站建设yu网站站长工具
  • 武汉网站建设模板如何制作怎么引流到微信呢
  • 深圳高端网站定制设计爱站seo工具
  • 做网站的公司有哪些广告营销的经典案例
  • 帮助中心网站怎么做中国50强企业管理培训机构
  • 学校网站建设的申请seo优化网站源码
  • 做淘宝导航网站b站推广网站入口
  • 什么时候能用ipv6做网站东莞网络优化哪家好
  • 北京国贸网站建设百度如何搜索网址
  • 苏州网络销售公司做网络优化的公司排名
  • 有没有在线制作app网站开发平台网络舆情信息
  • 做网站域名还重要吗seo竞价排名
  • 绿植网站怎么做培训心得简短