当前位置: 首页 > wzjs >正文

网站开发步骤需求分析小域名 网站备案

网站开发步骤需求分析,小域名 网站备案,网站宣传制作,dream8网站建设及设计一、环境准备 在搭建 Spark on YARN 集群之前,需要确保以下环境已经准备就绪: 操作系统:推荐使用 CentOS、Ubuntu 等 Linux 发行版。 Java 环境:确保安装了 JDK 1.8 或更高版本。 Hadoop 集群:已经搭建并运行的 Had…

一、环境准备

在搭建 Spark on YARN 集群之前,需要确保以下环境已经准备就绪:

  1. 操作系统:推荐使用 CentOS、Ubuntu 等 Linux 发行版。

  2. Java 环境:确保安装了 JDK 1.8 或更高版本。

  3. Hadoop 集群:已经搭建并运行的 Hadoop 集群,包括 HDFS 和 YARN。

二、安装 Spark

  1. 下载 Spark
    从 Apache Spark 官方网站下载适合您 Hadoop 版本的 Spark 安装包。例如,如果您使用的是 Hadoop 3.2,可以下载 spark-3.1.2-bin-hadoop3.2.tgz

  2. 解压并安装
    将下载的 Spark 安装包解压到指定目录,并创建符号链接以便管理。

    cd /opt/modules/
    tar -zxf spark-3.1.2-bin-hadoop3.2.tgz -C /opt/installs
    cd /opt/installs
    mv spark-3.1.2-bin-hadoop3.2 spark-yarn
    ln -s /opt/installs/spark-yarn /opt/installs/spark

三、配置 Spark

  1. 修改 spark-env.sh 配置文件。
    在 Spark 的 conf 目录中,将 spark-env.sh.template 文件重命名为 spark-env.sh,并编辑该文件。

    cd /opt/installs/spark/conf
    mv spark-env.sh.template spark-env.sh
    vim spark-env.sh

    在文件中添加以下内容:

    export JAVA_HOME=/opt/installs/jdk
    export HADOOP_CONF_DIR=/opt/installs/hadoop/etc/hadoop
    export YARN_CONF_DIR=/opt/installs/hadoop/etc/hadoop
    export SPARK_DAEMON_MEMORY=1g
    export SPARK_HISTORY_OPTS="-Dspark.history.fs.logDirectory=hdfs://bigdata01:9820/spark/eventLogs/ -Dspark.history.fs.cleaner.enabled=true"
  2. 修改 spark-defaults.conf 文件。
    spark-defaults.conf.template 文件重命名为 spark-defaults.conf,并编辑该文件:

    mv spark-defaults.conf.template spark-defaults.conf
    vim spark-defaults.conf

    添加以下内容:

    spark.eventLog.enabled           true
    spark.eventLog.dir               hdfs://bigdata01:9820/spark/eventLogs
    spark.eventLog.compress          true
    spark.yarn.historyServer.address bigdata01:18080
    spark.yarn.jars                  hdfs://bigdata01:9820/spark/jars/*
  3. 修改 YARN 配置文件
    编辑 Hadoop 的 yarn-site.xml 文件,确保以下配置项正确:

    <property><name>yarn.log-aggregation-enable</name><value>true</value>
    </property>
    <property><name>yarn.log-aggregation.retain-seconds</name><value>604800</value>
    </property>
    <property><name>yarn.log.server.url</name><value>http://bigdata01:19888/jobhistory/logs</value>
    </property>
    <property><name>yarn.nodemanager.pmem-check-enabled</name><value>false</value>
    </property>
    <property><name>yarn.nodemanager.vmem-check-enabled</name><value>false</value>
    </property>
  4. 分发配置文件
    使用工具(如 xsync.sh)将配置文件同步到所有集群节点:

    xsync.sh /opt/installs/spark
    xsync.sh /opt/installs/hadoop/etc/hadoop/yarn-site.xml

四、启动集群

  1. 启动 Hadoop 集群
    确保 HDFS 和 YARN 服务已经启动:

    start-dfs.sh
    start-yarn.sh
  2. 启动 Spark History Server
    启动 Spark 的历史服务器:

    /opt/installs/spark/sbin/start-history-server.sh

五、测试集群

  1. 提交测试作业
    使用 spark-submit 提交一个简单的 Spark 作业:

    spark-submit --master yarn --deploy-mode cluster examples/src/main/python/pi.py 1000
  2. 查看作业运行情况
    在 YARN 的 Web UI 页面(通常是 http://master:8088)中查看作业的运行情况

http://www.dtcms.com/wzjs/755273.html

相关文章:

  • 陕煤化建设集团网站矿建二公司seo长尾关键词
  • 怎么样子做网站建设网络强国要有自己的技术
  • 网络彩票网站建设自己如何做简单网站
  • 下载百度app最新版到桌面谈谈你对seo概念的理解
  • 中山网站建设哪家强茶山网站建设
  • 安庆市网站建设网站建设所需费用
  • 中国建设银行网站忘记密码网片加工厂家
  • 股票订阅网站开发饰品网站设计方案
  • 网站丢失了怎么办啊网站建设及发布的流程图
  • 雅安市建设工程招投标网站工程建设领域专项治理工作网站
  • 自己的公网ip可以做网站wordpress播放本地mp4
  • 手机网站百度关键词排名查询盐城工程造价信息网
  • 绍兴建站服务中国石化工程建设有限公司设计许可证编号
  • 水利工程建设信息网站php网站开发背景
  • 济南建设网站企业报价app是怎么开发的
  • 如何建立一个大型的网站做公司网站视频
  • 怎么用2级目录做网站推荐做任务网站
  • 网站开发设计知乎新人做外贸哪个平台好做
  • 网站开发模块学些什么软件前端网站开发工具
  • 做网站怎么配电脑品牌建设实施方案
  • 推荐常州微信网站建设重庆今天重大新闻
  • 凡科网做网站收费吗怎么在网站上做模式题库
  • mc做地图画网站wordpress文章同步插件
  • 太原怎样优化网站建设梵讯企业网站建设
  • 品牌网站分析网站后台html5模板
  • 做网站被骗五千多如何判断网站做的关键词
  • 中国建设工程网官方网站咋么做网站
  • 郑州哪家公司给国外做网站网站建设与管理A卷
  • 可以做问卷挣钱的网站自适应网站建设软件
  • 集团网站开发费用html5网站开发工具