在Spark中通过jps命令看到的进程名,是哪个命令产生有什么作用
Hadoop 分布式系统中的相关进程:
-
Worker:
- 产生命令:yarn命令产生。
- 作用:在 YARN(Yet Another Resource Negotiator)中,Worker(通常指 NodeManager)负责管理单个节点上的资源和任务执行。它与 ResourceManager 通信,接收并执行分配给它的任务。
-
NodeManager:
-
产生命令:
yarn
命令产生。 -
作用:NodeManager 是 YARN 中的节点代理,负责管理单个节点上的资源和任务执行。它与 ResourceManager 通信,接收并执行分配给它的任务。
-
-
DataNode:
-
产生命令:
hadoop
命令产生。 -
作用:DataNode 是 Hadoop 分布式文件系统(HDFS)中的工作节点,负责存储实际的数据块。它与 NameNode 通信,接收数据块的读写请求。
-
-
Master:
-
产生命令:这个名称不太明确,在 Hadoop 相关环境中可能指 ResourceManager(YARN)或 HDFS 中的 NameNode。
-
作用:如果是 ResourceManager,它负责集群资源的分配和管理;如果是 NameNode,它负责管理文件系统的命名空间和数据块的映射关系。
-
-
NameNode:
-
产生命令:
hadoop
命令产生。 -
作用:NameNode 是 HDFS 的主节点,负责管理文件系统的命名空间和数据块的映射关系。它维护文件系统的目录树和文件元数据。
-
-
JobHistoryServer:
-
产生命令:
mapred
命令产生。 -
作用:JobHistoryServer 负责存储和提供已完成的 MapReduce 作业的历史记录。用户可以通过它查看作业的执行情况和统计信息。
-
-
HistoryServer:
-
产生命令:
yarn
命令产生。 -
作用:在 YARN 环境中,HistoryServer 负责存储和提供已完成的应用程序(包括 MapReduce、Spark 等)的历史记录。用户可以通过它查看应用程序的执行情况和统计信息。
-