当前位置：首页 > wzjs >正文

企业做网站需注意什么企业网站开发

wzjs 2025/8/16 12:27:30

企业做网站需注意什么,企业网站开发,设置网站标签,保定网站建设公司有靠谱的吗一、环境准备在搭建 Spark on YARN 集群之前，需要确保以下环境已经准备就绪： 操作系统：推荐使用 CentOS、Ubuntu 等 Linux 发行版。 Java 环境：确保安装了 JDK 1.8 或更高版本。 Hadoop 集群：已经搭建并运行的 Had…

一、环境准备

在搭建 Spark on YARN 集群之前，需要确保以下环境已经准备就绪：

操作系统：推荐使用 CentOS、Ubuntu 等 Linux 发行版。
Java 环境：确保安装了 JDK 1.8 或更高版本。
Hadoop 集群：已经搭建并运行的 Hadoop 集群，包括 HDFS 和 YARN。

二、安装 Spark

下载 Spark
从 Apache Spark 官方网站下载适合您 Hadoop 版本的 Spark 安装包。例如，如果您使用的是 Hadoop 3.2，可以下载 spark-3.1.2-bin-hadoop3.2.tgz。

解压并安装
将下载的 Spark 安装包解压到指定目录，并创建符号链接以便管理。

cd /opt/modules/
tar -zxf spark-3.1.2-bin-hadoop3.2.tgz -C /opt/installs
cd /opt/installs
mv spark-3.1.2-bin-hadoop3.2 spark-yarn
ln -s /opt/installs/spark-yarn /opt/installs/spark

三、配置 Spark

修改 spark-env.sh 配置文件。
在 Spark 的 conf 目录中，将 spark-env.sh.template 文件重命名为 spark-env.sh，并编辑该文件。

cd /opt/installs/spark/conf
mv spark-env.sh.template spark-env.sh
vim spark-env.sh

在文件中添加以下内容：

export JAVA_HOME=/opt/installs/jdk
export HADOOP_CONF_DIR=/opt/installs/hadoop/etc/hadoop
export YARN_CONF_DIR=/opt/installs/hadoop/etc/hadoop
export SPARK_DAEMON_MEMORY=1g
export SPARK_HISTORY_OPTS="-Dspark.history.fs.logDirectory=hdfs://bigdata01:9820/spark/eventLogs/ -Dspark.history.fs.cleaner.enabled=true"

修改 spark-defaults.conf 文件。
将 spark-defaults.conf.template 文件重命名为 spark-defaults.conf，并编辑该文件：

mv spark-defaults.conf.template spark-defaults.conf
vim spark-defaults.conf

添加以下内容：

spark.eventLog.enabled           true
spark.eventLog.dir               hdfs://bigdata01:9820/spark/eventLogs
spark.eventLog.compress          true
spark.yarn.historyServer.address bigdata01:18080
spark.yarn.jars                  hdfs://bigdata01:9820/spark/jars/*

修改 YARN 配置文件
编辑 Hadoop 的 yarn-site.xml 文件，确保以下配置项正确：

<property><name>yarn.log-aggregation-enable</name><value>true</value>
</property>
<property><name>yarn.log-aggregation.retain-seconds</name><value>604800</value>
</property>
<property><name>yarn.log.server.url</name><value>http://bigdata01:19888/jobhistory/logs</value>
</property>
<property><name>yarn.nodemanager.pmem-check-enabled</name><value>false</value>
</property>
<property><name>yarn.nodemanager.vmem-check-enabled</name><value>false</value>
</property>

分发配置文件
使用工具（如 xsync.sh）将配置文件同步到所有集群节点：
```
xsync.sh /opt/installs/spark
xsync.sh /opt/installs/hadoop/etc/hadoop/yarn-site.xml
```

四、启动集群

启动 Hadoop 集群
确保 HDFS 和 YARN 服务已经启动：
```
start-dfs.sh
start-yarn.sh
```
启动 Spark History Server
启动 Spark 的历史服务器：
```
/opt/installs/spark/sbin/start-history-server.sh
```

五、测试集群

提交测试作业
使用 spark-submit 提交一个简单的 Spark 作业：

spark-submit --master yarn --deploy-mode cluster examples/src/main/python/pi.py 1000

查看作业运行情况
在 YARN 的 Web UI 页面（通常是 http://master:8088）中查看作业的运行情况

查看全文

http://www.dtcms.com/wzjs/367588.html

主要的电子商务网站有哪些百度个人中心登录

自己怎么1做网站cba排名

关于网站开发人员的薪资app接入广告变现

建网站怎么上线优化生育政策

企业vi设计欣赏安徽网络推广和优化

网站域名无法访问互联网最赚钱的行业

网站建设的付款方式seo网站分析工具

平顶山建设街小学网站2345网址中国最好

云南电商网站建设西安网站推广慧创科技

北京做网站公司的排名2023第二波疫情已经到来

手机网站设计框架百度提交入口地址在哪

个人网站做哪些内容想做网站找什么公司

西昌网站制作中央电视台新闻联播

专业微网站电话号码百度百科怎么创建自己

无锡自适应网站开发软文营销的案例

黑苹果做网站开发如何制作一个属于自己的网站

单页网站制作软件2023年6月份又封城了

公司内部网站设计什么是竞价推广

怎么做培训班网站上海app开发公司

云南热搜科技做网站不给源码学设计什么培训机构好

关于做好网站建设的通知最近新闻小学生摘抄

如何做好网站国际站seo优化是什么意思

上海网站建设seodian个人怎么在百度上做推广

完全静态化成wordpress移动网站如何优化排名

wordpress网站建设广州seo和网络推广

icp网站备案查询最成功的网络营销案例

做网站算经商吗广州优化网站排名

北京公司注册查询百度快照优化推广

济南住房和城乡建设部网站台州百度关键词排名

交友网站模板下载做一个app平台需要多少钱

一、环境准备

二、安装 Spark

三、配置 Spark

四、启动集群

五、测试集群

相关文章：