当前位置: 首页 > wzjs >正文

帮人家做家务的网站自助网站建设平台

帮人家做家务的网站,自助网站建设平台,管理咨询行业,腾讯oss wordpressHadoop 是一个开源的分布式计算框架,用于处理大规模数据。以下是在 Linux 系统上安装 Hadoop 的详细步骤: 1. 环境准备 安装 Java Hadoop 依赖 Java 环境,推荐使用 OpenJDK 8 或 11: bash # Ubuntu/Debian sudo apt update su…

Hadoop 是一个开源的分布式计算框架,用于处理大规模数据。以下是在 Linux 系统上安装 Hadoop 的详细步骤:

1. 环境准备

安装 Java

Hadoop 依赖 Java 环境,推荐使用 OpenJDK 8 或 11:

bash

# Ubuntu/Debian
sudo apt update
sudo apt install openjdk-8-jdk# CentOS/RHEL
sudo yum install java-1.8.0-openjdk-devel# 验证安装
java -version
配置 SSH 免密登录

bash

# 生成密钥对
ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa# 将公钥添加到授权列表
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 0600 ~/.ssh/authorized_keys# 测试 SSH 连接
ssh localhost

2. 下载并解压 Hadoop

bash

# 下载 Hadoop(以 3.3.6 版本为例)
wget https://dlcdn.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz# 解压文件
tar -xzvf hadoop-3.3.6.tar.gz -C /opt/# 创建软链接(可选,方便版本管理)
sudo ln -s /opt/hadoop-3.3.6 /opt/hadoop# 添加环境变量
echo '
export HADOOP_HOME=/opt/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export JAVA_HOME=$(readlink -f /usr/bin/java | sed "s:bin/java::")
' >> ~/.bashrc# 刷新环境变量
source ~/.bashrc

3. 配置 Hadoop

进入 Hadoop 配置目录:

bash

cd /opt/hadoop/etc/hadoop
编辑 core-site.xml

xml

<configuration><property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value></property>
</configuration>
编辑 hdfs-site.xml

xml

<configuration><property><name>dfs.replication</name><value>1</value></property><property><name>dfs.namenode.name.dir</name><value>file:/opt/hadoop/data/namenode</value></property><property><name>dfs.datanode.data.dir</name><value>file:/opt/hadoop/data/datanode</value></property>
</configuration>
编辑 mapred-site.xml

xml

<configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property>
</configuration>
编辑 yarn-site.xml

xml

<configuration><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.nodemanager.env-whitelist</name><value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value></property>
</configuration>
配置 Java 路径

编辑 hadoop-env.sh,添加:

bash

export JAVA_HOME=$(readlink -f /usr/bin/java | sed "s:bin/java::")

4. 初始化 HDFS

bash

# 创建数据目录
mkdir -p /opt/hadoop/data/namenode
mkdir -p /opt/hadoop/data/datanode# 格式化 NameNode
hdfs namenode -format

5. 启动 Hadoop

bash

# 启动 HDFS
start-dfs.sh# 启动 YARN
start-yarn.sh# 查看进程
jps

正常情况下,会看到以下进程:

  • NameNode
  • DataNode
  • SecondaryNameNode
  • ResourceManager
  • NodeManager

6. 验证安装

访问 Web 界面
  • NameNode 状态:http://localhost:9870
  • ResourceManager 状态:http://localhost:8088
运行示例作业

bash

# 创建测试目录
hdfs dfs -mkdir -p /user/hadoop# 上传文件到 HDFS
hdfs dfs -put /etc/profile /user/hadoop/# 运行 WordCount 示例
hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar wordcount /user/hadoop/profile /user/hadoop/output# 查看结果
hdfs dfs -cat /user/hadoop/output/part-r-00000

7. 停止 Hadoop

bash

stop-yarn.sh
stop-dfs.sh

http://www.dtcms.com/wzjs/398236.html

相关文章:

  • 如何制作一个个人网站品牌软文范文
  • 访问WordPress速度seo建站系统
  • 北京加盟网站建设2020 惠州seo服务
  • 昆明网站制作公司哪家靠谱百度广告联盟平台
  • 网站开发与移动互联百度游戏中心app
  • python基础教程for循环搜索引擎优化是指什么
  • 山东 网站建设东莞市网站seo内容优化
  • 做网站开发要学多久河南推广网站的公司
  • 怎么知道网站的空间是谁做的手机搭建网站
  • 运动鞋网站建设目的百度上首页
  • 建立网站的条件百度一级代理商
  • 织梦手机网站模板删除产品营销策划方案3000字
  • 深圳建网站的网络公司软文写作技巧有哪些
  • 上海做网站优化的公司广州网站优化服务
  • 如何用工控做网站网站搭建关键词排名
  • 淘宝客网站做app企业营销战略
  • 大连做网站优化公司市场推广专员
  • 南同网站建设青岛网站推广企业
  • 长春 网站 设计博客网
  • 做网站鞍山免费国外ddos网站
  • 做外贸最好的网站建设洛阳网站seo
  • 某旅行社网站建设规划书seo推广知识
  • 天津 网站建设百度游戏客服在线咨询
  • 上海微信网站建设怎么去做推广
  • 1个ip可以做几个网站吗关键词工具
  • 优化网站的网站广告联盟自动挂机赚钱
  • index网站制作哪里有竞价推广托管
  • 网站优化seo推广服务站长工具seo综合
  • 卡通网站建设南昌seo技术外包
  • 音乐网站系统怎么做西安百度竞价托管代运营