元数据管理与数据治理平台:Apache Atlas 构建与安装 Building Installing Apache Atlas
文中内容仅限技术学习与代码实践参考,市场存在不确定性,技术分析需谨慎验证,不构成任何投资建议。
Apache Atlas 框架是一套可扩展的核心基础治理服务,使企业能够有效、高效地满足 Hadoop 中的合规性要求,并支持与整个企业数据生态系统集成。这将通过使用规范和取证模型,以及技术和运营审计以及由业务分类元数据丰富的沿袭,在 Hadoop 中提供真正的可视性。它还使任何元数据使用者能够互操作,而无需彼此独立的接口——元数据存储是通用的。通过利用 Apache Ranger 来维护元数据的准确性,以防止在运行时对数据进行未经授权的访问。安全性基于角色 (RBAC) 和属性 (ABAC)。
构建与安装 Apache Atlas
Building & Installing Apache Atlas
构建 Apache Atlas
从 downloads 页面下载 Apache Atlas 2.4.0 发布源码包 apache-atlas-2.4.0-sources.tar.gz。
然后按以下步骤构建 Apache Atlas。
tar xvfz apache-atlas-2.4.0-sources.tar.gz
cd apache-atlas-sources-2.4.0/
export MAVEN_OPTS="-Xms2g -Xmx2g"
mvn clean -DskipTests install
打包 Apache Atlas
若要在已具备可用 Apache HBase 与 Apache Solr 实例的环境中部署 Apache Atlas,请使用以下命令构建:
mvn clean -DskipTests package -Pdist
- 注意:
- 移除选项 ‘-DskipTests’ 可运行单元与集成测试
- 如需构建不含压缩 js、css 文件的发行版,请使用 skipMinify profile。默认情况下,js 与 css 文件会被压缩。
上述命令将为具备可用 HBase 与 Solr 实例的环境构建 Apache Atlas。在该环境中运行 Apache Atlas 需完成以下设置:
- 配置 atlas.graph.storage.hostname(参见 Configuration 章节中的 “Graph persistence engine - HBase”)
- 配置 atlas.graph.index.search.solr.zookeeper-url(参见 Configuration 章节中的 “Graph Search Index - Solr”)
- 将 HBASE_CONF_DIR 指向有效的 Apache HBase 配置目录(参见 Configuration 章节中的 “Graph persistence engine - HBase”)
- 在 Apache Solr 中创建索引(参见 Configuration 章节中的 “Graph Search Index - Solr”)
打包包含嵌入式 Apache HBase 与 Apache Solr 的 Apache Atlas
如需创建包含 Apache HBase 与 Apache Solr 的 Apache Atlas 包,请使用 embedded-hbase-solr profile,命令如下:
mvn clean -DskipTests package -Pdist,embedded-hbase-solr
使用 embedded-hbase-solr profile 将配置 Apache Atlas,使其在启动与停止 Apache Atlas 服务器时,同步启动与停止 Apache HBase 实例和 Apache Solr 实例。
注意:此发行版 profile 仅适用于单节点开发环境,不可用于生产环境。
打包包含 BerkeleyDB 与 Apache Solr 的 Apache Atlas
如需创建包含 BerkeleyDB 与 Apache Solr 的 Apache Atlas 包,请使用 berkeley-solr profile,命令如下:
mvn clean -DskipTests package -Pdist,berkeley-solr
使用 berkeley-solr profile 将配置 Apache Atlas,使其在启动与停止 Apache Atlas 服务器时,同步启动与停止 Apache Solr 实例和 Apache Zookeeper 实例。
注意:此发行版 profile 仅适用于单节点开发环境,不可用于生产环境。
打包包含嵌入式 Apache Cassandra 与 Apache Solr 的 Apache Atlas
如需创建包含 Apache Cassandra 与 Apache Solr 的 Apache Atlas 包,请使用 embedded-cassandra-solr profile,命令如下:
mvn clean package -Pdist,embedded-cassandra-solr
使用 embedded-cassandra-solr profile 将配置 Apache Atlas,使其在启动与停止 Atlas 服务器时,同步启动与停止 Apache Cassandra 实例与 Apache Solr 实例。
注意:此发行版 profile 仅适用于单节点开发环境,不可用于生产环境。
Apache Atlas 包
构建完成后将生成以下文件,用于安装 Apache Atlas。
distro/target/apache-atlas-{project.version}-bin.tar.gz
distro/target/apache-atlas-{project.version}-hbase-hook.tar.gz
distro/target/apache-atlas-{project.version}-hive-hook.gz
distro/target/apache-atlas-{project.version}-kafka-hook.gz
distro/target/apache-atlas-{project.version}-sources.tar.gz
distro/target/apache-atlas-{project.version}-sqoop-hook.tar.gz
distro/target/apache-atlas-{project.version}-storm-hook.tar.gz
风险提示与免责声明
本文内容基于公开信息研究整理,不构成任何形式的投资建议。历史表现不应作为未来收益保证,市场存在不可预见的波动风险。投资者需结合自身财务状况及风险承受能力独立决策,并自行承担交易结果。作者及发布方不对任何依据本文操作导致的损失承担法律责任。市场有风险,投资须谨慎。