当前位置: 首页 > news >正文

塘沽网站制作公司泰安网站建设焦点网络

塘沽网站制作公司,泰安网站建设焦点网络,达州网站建设公司,用户体验设计软件Spark的最简安装 1. 下载并解压 Spark 首先,我们需要下载 Spark 安装包。您可以选择以下方式之一: 方式一:从官网下载(推荐) # 在 hadoop01 节点上执行 cd /home/hadoop/app wget https://archive.apache.org/dist/spark/spark-2.3.1/spark-2.3.1-bin-hadoop2.7.tgz方…

Spark的最简安装

1. 下载并解压 Spark

首先,我们需要下载 Spark 安装包。您可以选择以下方式之一:

方式一:从官网下载(推荐)

# 在 hadoop01 节点上执行
cd /home/hadoop/app
wget https://archive.apache.org/dist/spark/spark-2.3.1/spark-2.3.1-bin-hadoop2.7.tgz

方式二:如果已有安装包,直接解压

cd /home/hadoop/app
# 如果已经有安装包,直接解压
tar -zxvf spark-2.3.1-bin-hadoop2.7.tgz
# 创建软链接
ln -s spark-2.3.1-bin-hadoop2.7 spark

在这里插入图片描述

2. 测试运行 Spark

(1) 准备测试数据集
cd /home/hadoop/app/spark
# 创建测试文件
cat > djt.log << EOF
hadoop hadoop hadoop spark spark spark
EOF# 查看文件内容
cat djt.log

在这里插入图片描述

(2) Spark shell 测试运行单词词频统计
# 启动 Spark shell
bin/spark-shell# 等待 Spark shell 启动完成,看到 scala> 提示符后,依次输入以下命令:

在 Spark shell 中输入以下命令:

// 读取本地文件
val line = sc.textFile("/home/hadoop/app/spark/djt.log")// WordCount 统计并打印
line.flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collect().foreach(println)

预期输出:

(spark,3)
(hadoop,3)

在这里插入图片描述

3. Spark 实现 WordCount(Scala 程序)

步骤1:下载 Hadoop 及 winutils.exe

1.1 下载 Hadoop 2.7.1 安装包

链接参考https://blog.csdn.net/qq_39900031/article/details/121080109

好的,我把 Windows 下 Hadoop 环境配置的 完整详细过程整理给你(以 Hadoop 2.7.1 + JDK1.8 为例):


一、准备工作

  1. 安装 JDK1.8

    • 下载 JDK1.8 并安装,推荐路径如:C:\Java\jdk1.8.0_221

    • 配置环境变量:

      • JAVA_HOME=C:\Java\jdk1.8.0_221
      • PATH 中添加:%JAVA_HOME%\bin
      • 新建 CLASSPATH=.;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar
  2. 下载 Hadoop 2.7.1

    • 地址:http://archive.apache.org/dist/hadoop/core/hadoop-2.7.1/
    • 解压到:C:\hadoop-2.7.1
  3. 下载 HadoopOnWindows 适配包

    • GitHub 或 CSDN 提供的 hadooponwindows-master.zip
    • 解压后,把里面的 bin 和 etc 文件夹 覆盖到 C:\hadoop-2.7.1 目录下。

二、配置 Hadoop 环境变量

系统环境变量中新建:

  • HADOOP_HOME=C:\hadoop-2.7.1
  • PATH 添加:%HADOOP_HOME%\bin;%HADOOP_HOME%\sbin

三、修改配置文件

进入 C:\hadoop-2.7.1\etc\hadoop 目录:

  1. hadoop-env.cmd

    set JAVA_HOME=C:\Java\jdk1.8.0_221
    
  2. core-site.xml

    <configuration><property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value></property><property><name>hadoop.tmp.dir</name><value>C:/hadoop-2.7.1/tmp</value>
http://www.dtcms.com/a/455450.html

相关文章:

  • 外国做动漫图片的网站叫什么名字网站建设系统规划方案
  • 做减肥餐的网站免费标志在线设计
  • 江苏工信部网站备案查询自己做彩票网站合法吗
  • 网站建设 三网动力启航做网站
  • 网站服务器用什么配置东莞网站建设制作价格
  • 单位网站备案流程app手机应用软件开发
  • 南县网站开发手机做网站的教程
  • 京东客网站怎么做宁波seo怎么做优化公司
  • @ComponentScan组件扫描原理(二)
  • linux网络服务+linux数据库4
  • 做网站的代码难吗wordpress弹窗视频播放插件
  • 网站网址更新了怎么查镇江网站制作服务
  • 智能硬件开发流程网站优化要怎么做
  • 谁做视频网站上海网站备案中心
  • 打工人日报#20251007
  • 如何做律所网站做义工旅行有哪些网站
  • 贵阳网站建设宏思锐达银川市住房和城乡建设局网站公告
  • 连云港市建设局网站安全员考试广州网站建设支付
  • 网站粘度计算公式微信小程序制作网站
  • 有哪些做短租的网站好龙岗区住房和建设局网站打不开
  • 宝塔面板建设网站安徽人
  • 宁波制作网站企业二级域名做外贸网站好吗
  • 外卖网站的建设与推广织梦和wordpress哪个seo好
  • 专业做足球体彩网站网站备案应该怎么做
  • 什么网站可以做时间加减微信 公众号导入wordpress
  • 内江做网站哪里便宜美容院顾客管理系统软件
  • 培训网站官网企业账号登录入口
  • jq效果较多的网站世界工厂网app
  • php 手机网站乐陵seo公司
  • 上海网站制作机构西安复工无需核酸检测