当前位置: 首页 > news >正文

元数据管理与数据治理平台:Apache Atlas 构建与安装 Building Installing Apache Atlas

文中内容仅限技术学习与代码实践参考,市场存在不确定性,技术分析需谨慎验证,不构成任何投资建议。

Apache Atlas
Apache Atlas 框架是一套可扩展的核心基础治理服务,使企业能够有效、高效地满足 Hadoop 中的合规性要求,并支持与整个企业数据生态系统集成。这将通过使用规范和取证模型,以及技术和运营审计以及由业务分类元数据丰富的沿袭,在 Hadoop 中提供真正的可视性。它还使任何元数据使用者能够互操作,而无需彼此独立的接口——元数据存储是通用的。通过利用 Apache Ranger 来维护元数据的准确性,以防止在运行时对数据进行未经授权的访问。安全性基于角色 (RBAC) 和属性 (ABAC)。

构建与安装 Apache Atlas

Building & Installing Apache Atlas

构建 Apache Atlas

从 downloads 页面下载 Apache Atlas 2.4.0 发布源码包 apache-atlas-2.4.0-sources.tar.gz。
然后按以下步骤构建 Apache Atlas。

tar xvfz apache-atlas-2.4.0-sources.tar.gz
cd apache-atlas-sources-2.4.0/
export MAVEN_OPTS="-Xms2g -Xmx2g"
mvn clean -DskipTests install

打包 Apache Atlas

若要在已具备可用 Apache HBase 与 Apache Solr 实例的环境中部署 Apache Atlas,请使用以下命令构建:

mvn clean -DskipTests package -Pdist
  • 注意:
    • 移除选项 ‘-DskipTests’ 可运行单元与集成测试
    • 如需构建不含压缩 js、css 文件的发行版,请使用 skipMinify profile。默认情况下,js 与 css 文件会被压缩。

上述命令将为具备可用 HBase 与 Solr 实例的环境构建 Apache Atlas。在该环境中运行 Apache Atlas 需完成以下设置:

  • 配置 atlas.graph.storage.hostname(参见 Configuration 章节中的 “Graph persistence engine - HBase”)
  • 配置 atlas.graph.index.search.solr.zookeeper-url(参见 Configuration 章节中的 “Graph Search Index - Solr”)
  • 将 HBASE_CONF_DIR 指向有效的 Apache HBase 配置目录(参见 Configuration 章节中的 “Graph persistence engine - HBase”)
  • 在 Apache Solr 中创建索引(参见 Configuration 章节中的 “Graph Search Index - Solr”)

打包包含嵌入式 Apache HBase 与 Apache Solr 的 Apache Atlas

如需创建包含 Apache HBase 与 Apache Solr 的 Apache Atlas 包,请使用 embedded-hbase-solr profile,命令如下:

mvn clean -DskipTests package -Pdist,embedded-hbase-solr

使用 embedded-hbase-solr profile 将配置 Apache Atlas,使其在启动与停止 Apache Atlas 服务器时,同步启动与停止 Apache HBase 实例和 Apache Solr 实例。

注意:此发行版 profile 仅适用于单节点开发环境,不可用于生产环境。

打包包含 BerkeleyDB 与 Apache Solr 的 Apache Atlas

如需创建包含 BerkeleyDB 与 Apache Solr 的 Apache Atlas 包,请使用 berkeley-solr profile,命令如下:

mvn clean -DskipTests package -Pdist,berkeley-solr

使用 berkeley-solr profile 将配置 Apache Atlas,使其在启动与停止 Apache Atlas 服务器时,同步启动与停止 Apache Solr 实例和 Apache Zookeeper 实例。

注意:此发行版 profile 仅适用于单节点开发环境,不可用于生产环境。

打包包含嵌入式 Apache Cassandra 与 Apache Solr 的 Apache Atlas

如需创建包含 Apache Cassandra 与 Apache Solr 的 Apache Atlas 包,请使用 embedded-cassandra-solr profile,命令如下:

mvn clean package -Pdist,embedded-cassandra-solr

使用 embedded-cassandra-solr profile 将配置 Apache Atlas,使其在启动与停止 Atlas 服务器时,同步启动与停止 Apache Cassandra 实例与 Apache Solr 实例。

注意:此发行版 profile 仅适用于单节点开发环境,不可用于生产环境。

Apache Atlas 包

构建完成后将生成以下文件,用于安装 Apache Atlas。

distro/target/apache-atlas-{project.version}-bin.tar.gz
distro/target/apache-atlas-{project.version}-hbase-hook.tar.gz
distro/target/apache-atlas-{project.version}-hive-hook.gz
distro/target/apache-atlas-{project.version}-kafka-hook.gz
distro/target/apache-atlas-{project.version}-sources.tar.gz
distro/target/apache-atlas-{project.version}-sqoop-hook.tar.gz
distro/target/apache-atlas-{project.version}-storm-hook.tar.gz

风险提示与免责声明
本文内容基于公开信息研究整理,不构成任何形式的投资建议。历史表现不应作为未来收益保证,市场存在不可预见的波动风险。投资者需结合自身财务状况及风险承受能力独立决策,并自行承担交易结果。作者及发布方不对任何依据本文操作导致的损失承担法律责任。市场有风险,投资须谨慎。

http://www.dtcms.com/a/321642.html

相关文章:

  • 有哪些产品需要遵循ASTM D4169-23e1
  • 【ee类保研面试】其他类---计算机网络
  • 操作系统:多线程模型(Multithreading Models)与超线程技术(Hyperthreading)
  • AI漫画翻译器-上传图片自动翻译,支持多语言
  • 学习Java的Day27
  • 基于ffmpeg和rk3588的mpp编解码库多路融屏程序设计
  • Git 基础操作笔记(速查)
  • 嵌入式Linux学习 - 数据结构6
  • 【设计模式】抽象工厂模式 (工具(Kit)模式)
  • PPT科研绘图实践笔记(持续更新)
  • AI 编程工具使用心得与对比评测
  • Python实现点云PCA配准——粗配准
  • 三种经典寻路算法对比
  • 微服务的好与坏
  • kafak
  • 经常问的14000
  • HTML5 Web Workers 深度剖析:助力网页性能飞速提升
  • imx6ull-驱动开发篇14——原子操作
  • FFmpeg 视频旋转信息处理:3.4 vs 7.0.2
  • 开发避坑指南(22):Vue3响应式编程中this绑定机制与解决方案
  • C++ 部署LSTM(.onnx)
  • 大模型中的核心参数temperature 您知道是什么东东吗?
  • KEIL 环境下 printf 导致程序无法执行的解决方案
  • GPT5评测对比与使用
  • 2025年城市建设与智慧交通国际会议(ICUCIT 2025)
  • OpenAI重磅开源回归!GPT-OSS-120B/20B登陆星辰MaaS
  • 【长度最小的子数组】
  • C++ 红黑树实现详解:理论+代码+图解
  • 主流多模态大模型使用总结
  • GPT-5测评:AI新纪元的开启还是炒作?