当前位置：首页 > wzjs >正文

网站开发步骤需求分析小域名网站备案

wzjs 2025/9/16 13:45:31

网站开发步骤需求分析,小域名网站备案,网站宣传制作,dream8网站建设及设计一、环境准备在搭建 Spark on YARN 集群之前，需要确保以下环境已经准备就绪： 操作系统：推荐使用 CentOS、Ubuntu 等 Linux 发行版。 Java 环境：确保安装了 JDK 1.8 或更高版本。 Hadoop 集群：已经搭建并运行的 Had…

一、环境准备

在搭建 Spark on YARN 集群之前，需要确保以下环境已经准备就绪：

操作系统：推荐使用 CentOS、Ubuntu 等 Linux 发行版。
Java 环境：确保安装了 JDK 1.8 或更高版本。
Hadoop 集群：已经搭建并运行的 Hadoop 集群，包括 HDFS 和 YARN。

二、安装 Spark

下载 Spark
从 Apache Spark 官方网站下载适合您 Hadoop 版本的 Spark 安装包。例如，如果您使用的是 Hadoop 3.2，可以下载 spark-3.1.2-bin-hadoop3.2.tgz。

解压并安装
将下载的 Spark 安装包解压到指定目录，并创建符号链接以便管理。

cd /opt/modules/
tar -zxf spark-3.1.2-bin-hadoop3.2.tgz -C /opt/installs
cd /opt/installs
mv spark-3.1.2-bin-hadoop3.2 spark-yarn
ln -s /opt/installs/spark-yarn /opt/installs/spark

三、配置 Spark

修改 spark-env.sh 配置文件。
在 Spark 的 conf 目录中，将 spark-env.sh.template 文件重命名为 spark-env.sh，并编辑该文件。

cd /opt/installs/spark/conf
mv spark-env.sh.template spark-env.sh
vim spark-env.sh

在文件中添加以下内容：

export JAVA_HOME=/opt/installs/jdk
export HADOOP_CONF_DIR=/opt/installs/hadoop/etc/hadoop
export YARN_CONF_DIR=/opt/installs/hadoop/etc/hadoop
export SPARK_DAEMON_MEMORY=1g
export SPARK_HISTORY_OPTS="-Dspark.history.fs.logDirectory=hdfs://bigdata01:9820/spark/eventLogs/ -Dspark.history.fs.cleaner.enabled=true"

修改 spark-defaults.conf 文件。
将 spark-defaults.conf.template 文件重命名为 spark-defaults.conf，并编辑该文件：

mv spark-defaults.conf.template spark-defaults.conf
vim spark-defaults.conf

添加以下内容：

spark.eventLog.enabled           true
spark.eventLog.dir               hdfs://bigdata01:9820/spark/eventLogs
spark.eventLog.compress          true
spark.yarn.historyServer.address bigdata01:18080
spark.yarn.jars                  hdfs://bigdata01:9820/spark/jars/*

修改 YARN 配置文件
编辑 Hadoop 的 yarn-site.xml 文件，确保以下配置项正确：

<property><name>yarn.log-aggregation-enable</name><value>true</value>
</property>
<property><name>yarn.log-aggregation.retain-seconds</name><value>604800</value>
</property>
<property><name>yarn.log.server.url</name><value>http://bigdata01:19888/jobhistory/logs</value>
</property>
<property><name>yarn.nodemanager.pmem-check-enabled</name><value>false</value>
</property>
<property><name>yarn.nodemanager.vmem-check-enabled</name><value>false</value>
</property>

分发配置文件
使用工具（如 xsync.sh）将配置文件同步到所有集群节点：
```
xsync.sh /opt/installs/spark
xsync.sh /opt/installs/hadoop/etc/hadoop/yarn-site.xml
```

四、启动集群

启动 Hadoop 集群
确保 HDFS 和 YARN 服务已经启动：
```
start-dfs.sh
start-yarn.sh
```
启动 Spark History Server
启动 Spark 的历史服务器：
```
/opt/installs/spark/sbin/start-history-server.sh
```

五、测试集群

提交测试作业
使用 spark-submit 提交一个简单的 Spark 作业：

spark-submit --master yarn --deploy-mode cluster examples/src/main/python/pi.py 1000

查看作业运行情况
在 YARN 的 Web UI 页面（通常是 http://master:8088）中查看作业的运行情况

查看全文

http://www.dtcms.com/wzjs/755273.html

陕煤化建设集团网站矿建二公司seo长尾关键词

怎么样子做网站建设网络强国要有自己的技术

网络彩票网站建设自己如何做简单网站

下载百度app最新版到桌面谈谈你对seo概念的理解

中山网站建设哪家强茶山网站建设

安庆市网站建设网站建设所需费用

中国建设银行网站忘记密码网片加工厂家

股票订阅网站开发饰品网站设计方案

网站丢失了怎么办啊网站建设及发布的流程图

雅安市建设工程招投标网站工程建设领域专项治理工作网站

自己的公网ip可以做网站wordpress播放本地mp4

手机网站百度关键词排名查询盐城工程造价信息网

绍兴建站服务中国石化工程建设有限公司设计许可证编号

水利工程建设信息网站php网站开发背景

济南建设网站企业报价app是怎么开发的

如何建立一个大型的网站做公司网站视频

怎么用2级目录做网站推荐做任务网站

网站开发设计知乎新人做外贸哪个平台好做

网站开发模块学些什么软件前端网站开发工具

做网站怎么配电脑品牌建设实施方案

推荐常州微信网站建设重庆今天重大新闻

凡科网做网站收费吗怎么在网站上做模式题库

mc做地图画网站wordpress文章同步插件

太原怎样优化网站建设梵讯企业网站建设

品牌网站分析网站后台html5模板

做网站被骗五千多如何判断网站做的关键词

中国建设工程网官方网站咋么做网站

郑州哪家公司给国外做网站网站建设与管理A卷

可以做问卷挣钱的网站自适应网站建设软件

集团网站开发费用html5网站开发工具

一、环境准备

二、安装 Spark

三、配置 Spark

四、启动集群

五、测试集群

相关文章：