当前位置：首页 > news >正文

济宁市网站建设新乡营销网站建设公司哪家好

news 2025/10/18 14:02:02

济宁市网站建设,新乡营销网站建设公司哪家好,上海高端网站建设定制,网站自动适应屏幕目录分布式内存计算Spark环境部署 1. 简介 2. 安装 2.1【node1执行】下载并解压 2.2【node1执行】修改配置文件名称 2.3【node1执行】修改配置文件，spark-env.sh 2.4 【node1执行】修改配置文件，slaves 2.5【node1执行】分发 2.6【node2、no…

分布式内存计算Spark环境部署

1. 简介

2. 安装

2.1【node1执行】下载并解压

2.2【node1执行】修改配置文件名称

2.3【node1执行】修改配置文件，spark-env.sh

2.4 【node1执行】修改配置文件，slaves

2.5【node1执行】分发

2.6【node2、node3执行】设置软链接

2.7【node1执行】启动Spark集群

2.8 打开Spark监控页面，浏览器打开：

2.9【node1执行】提交测试任务

分布式内存计算Flink环境部署

1. 简介

2. 安装

2.1【node1操作】下载安装包

2. 2【node1操作】修改配置文件，conf/flink-conf.yaml

2.3 【node1操作】，修改配置文件，conf/slaves

2.4【node1操作】分发Flink安装包到其它机器

2.5 【node2、node3操作】

2.6 【node1操作】，启动Flink

2.7 验证Flink启动

2.8 提交测试任务

注意：

本小节的操作，基于：大数据集群（Hadoop生态）安装部署环节中所构建的Hadoop集群，如果没有Hadoop集群，请参阅前置内容，部署好环境。

大数据集群（Hadoop生态）安装部署：

大数据集群（Hadoop生态）安装部署_时光の尘的博客-CSDN博客

大数据NoSQL数据库HBase集群部署：

大数据NoSQL数据库HBase集群部署-CSDN博客

分布式内存计算Spark环境部署

1. 简介

Spark是一款分布式内存计算引擎，可以支撑海量数据的分布式计算。

Spark在大数据体系是明星产品，作为最新一代的综合计算引擎，支持离线计算和实时计算。

在大数据领域广泛应用，是目前世界上使用最多的大数据分布式计算引擎。

我们将基于前面构建的Hadoop集群，部署Spark Standalone集群。

2. 安装

2.1【node1执行】下载并解压

wget https: / archive.apache.org/dist/spark/spark-2.4.5/spark-2.4.5-bin-hadoop2.7.tgz# 解压
tar -zxvf spark-2.4.5-bin-hadoop2.7.tgz -C /export/server/# 软链接
ln -s /export/server/spark-2.4.5-bin-hadoop2.7 /export/server/spark

2.2【node1执行】修改配置文件名称

# 改名
cd /export/server/spark/conf
mv spark-env.sh.template spark-env.sh
mv slaves.template slaves

2.3【node1执行】修改配置文件，spark-env.sh

#设置JAVA安装目录
JAVA_HOME=/export/server/jdk#HADOOP软件配置文件目录，读取HDFS上文件和运行YARN集群
HADOOP_CONF_DIR=/export/server/hadoop/etc/hadoop
YARN_CONF_DIR=/export/server/hadoop/etc/hadoop#指定spark老大Master的IP和提交任务的通信端口
export SPARK_MASTER_HOST=node1
export SPARK_MASTER_PORT=7077SPARK_MASTER_WEBUI_PORT=8080
SPARK_WORKER_CORES=1
SPARK_WORKER_MEMORY=1g

2.4 【node1执行】修改配置文件，slaves

node1
node2
node3

2.5【node1执行】分发

scp -r spark-2.4.5-bin-hadoop2.7 node2:$PWD
scp -r spark-2.4.5-bin-hadoop2.7 node3:$PWD

2.6【node2、node3执行】设置软链接

 ln -s /export/server/spark-2.4.5-bin-hadoop2.7 /export/server/spark

2.7【node1执行】启动Spark集群

/export/server/spark/sbin/start-all.sh# 如需停止，可以
/export/server/spark/sbin/stop-all.sh

2.8 打开Spark监控页面，浏览器打开：

http://node1:8081

2.9【node1执行】提交测试任务

/export/server/spark/bin/spark-submit --master
spark: / node1:7077 - class
org.apache.spark.examples.SparkPi
/export/server/spark/examples/jars/spark-examples_2.11-2.4.5.jar

分布式内存计算Flink环境部署

1. 简介

Flink同Spark一样，是一款分布式内存计算引擎，可以支撑海量数据的分布式计算。

Flink在大数据体系同样是明星产品，作为最新一代的综合计算引擎，支持离线计算和实时计算。

在大数据领域广泛应用，是目前世界上除去Spark以外，应用最为广泛的分布式计算引擎。

我们将基于前面构建的Hadoop集群，部署Flink Standalone集群

Spark更加偏向于离线计算而Flink更加偏向于实时计算。

2. 安装

2.1【node1操作】下载安装包

wget https: / archive.apache.org/dist/flink/flink-1.10.0/flink-1.10.0-bin-scala_2.11.tgz# 解压
tar -zxvf flink-1.10.0-bin-scala_2.11.tgz -C
/export/server/# 软链接
ln -s /export/server/flink-1.10.0
/export/server/flink

2. 2【node1操作】修改配置文件，conf/flink-conf.yaml

# jobManager 的IP地址
jobmanager.rpc.address: node1
# JobManager 的端口号
jobmanager.rpc.port: 6123
# JobManager JVM heap 内存大小
jobmanager.heap.size: 1024m
# TaskManager JVM heap 内存大小
taskmanager.heap.size: 1024m
# 每个 TaskManager 提供的任务 slots 数量大小
taskmanager.numberOfTaskSlots: 2#是否进行预分配内存，默认不进行预分配，这样在我们不使用flink集群时候不会占用集群资源
taskmanager.memory.preallocate: false
# 程序默认并行计算的个数
parallelism.default: 1
#JobManager的Web界面的端口（默认：8081）
jobmanager.web.port: 8081

2.3 【node1操作】，修改配置文件，conf/slaves

node1
node2
node3

2.4【node1操作】分发Flink安装包到其它机器

cd /export/server
scp -r flink-1.10.0 node2:`pwd`/
scp -r flink-1.10.0 node3:`pwd`/

2.5 【node2、node3操作】

# 配置软链接
ln -s /export/server/flink-1.10.0
/export/server/flink

2.6 【node1操作】，启动Flink

/export/server/flink/bin/start-cluster.sh

2.7 验证Flink启动

# 浏览器打开
http://node1:8081

2.8 提交测试任务

【node1执行】

/export/server/flink/bin/flink run
/export/server/flink-1.10.0/examples/batch/WordCount.jar

更多环境部署：

MySQL5.7版本与8.0版本在CentOS系统安装：

MySQL5.7版本与8.0版本在CentOS系统安装_时光の尘的博客-CSDN博客

MySQL5.7版本与8.0版本在Ubuntu（WSL环境）系统安装：

MySQL5.7版本与8.0版本在Ubuntu（WSL环境）系统安装-CSDN博客

Tomcat在CentOS上的安装部署：

Tomcat在CentOS上的安装部署-CSDN博客

Nginx在CentOS上的安装部署、RabbitMQ在CentOS上安装部署：

Nginx在CentOS上的安装部署、RabbitMQ在CentOS上安装部署-CSDN博客

集群化环境前置准备：

集群化环境前置准备_时光の尘的博客-CSDN博客

Zookeeper集群安装部署、Kafka集群安装部署：

Zookeeper集群安装部署、Kafka集群安装部署_时光の尘的博客-CSDN博客

查看全文

http://www.dtcms.com/a/491086.html

网站建设方案总结wordpress音频付费插件

解决VMware Workstation Pro 17中Ubuntu 24.04无法复制粘贴

上辽宁建设工程信息网站移动网站建设口碑好

【力扣 SQL 50】聚合函数篇

做网站如何用代码把字体变大云南定制化网站建设

免费建立微信网站好看的wordpress工具

【Go】--map和struct数据类型

go win安装grpc-gen-go插件

AI+Python驱动的无人机生态三维建模与碳储/生物量/LULC估算全流程实战技术

网站管理助手 mysql小程序免费网站

电商网站建设信息wordpress 中文转英文js

【实战宝典】MySQL字符串包含查询大全：LIKE、REGEXP、全文索引深度剖析与实战代码

手机网站推荐哪些学做莱网站

建设网站的价格分析网站构架图

后端八股之mysql

力扣2563. 统计公平数对的数目

在VMware上运行Linux（我选择的是Ubuntu）

【Linux内核】Linux系统启动之旅

正则表达式匹配不到表达式情况？

【数据结构与算法_学习精华】

第18讲：C语言内存函数

外贸网站如何做推广论坛网站备案

深圳网站建设首选h5case是什么网站

Matlab的交通标志定位实现

课堂网站开发企业管理培训班哪个好

记录一个自动学习的脚本开发过程

h5游戏免费下载：一起蛙蛙跳

chrome中的axure插件提示无法不受支持

石家庄住房城乡建设厅网站著名企业vi设计

深圳做网站的公司排名开个人网站如何赚钱

分布式内存计算Spark环境部署

1. 简介

2. 安装

2.1【node1执行】下载并解压

2.2【node1执行】修改配置文件名称

2.3【node1执行】修改配置文件，spark-env.sh

2.4 【node1执行】修改配置文件，slaves

2.5【node1执行】分发

2.6【node2、node3执行】设置软链接

2.7【node1执行】启动Spark集群

2.8 打开Spark监控页面，浏览器打开：

2.9【node1执行】提交测试任务

分布式内存计算Flink环境部署

1. 简介

2. 安装

2.1【node1操作】下载安装包

2. 2【node1操作】修改配置文件，conf/flink-conf.yaml

2.3 【node1操作】，修改配置文件，conf/slaves

2.4【node1操作】分发Flink安装包到其它机器

2.5 【node2、node3操作】

2.6 【node1操作】，启动Flink

2.7 验证Flink启动

2.8 提交测试任务

相关文章：