当前位置: 首页 > news >正文

windows安装spark

在 Windows 上安装 Spark 并进行配置需要一些步骤,包括安装必要的软件和配置环境变量。以下是详细的步骤指南:

步骤一:安装 Java

  1. 下载和安装 Java Development Kit (JDK)

    • 到 Oracle JDK 下载页面 或 OpenJDK 下载页面 下载适合你系统的 JDK。
    • 安装 JDK,记住安装路径。
  2. 配置环境变量

    • 右键点击“此电脑”或“计算机”,选择“属性”。

    • 点击“高级系统设置”。

    • 点击“环境变量”。

    • 在“系统变量”下,点击“新建”,然后添加以下内容:

      • 变量名:JAVA_HOME
      • 变量值:JDK 安装路径(例如:C:\Program Files\Java\jdk-11.0.10
    • 找到 Path 变量,选择它并点击“编辑”。在变量值的末尾添加以下内容:%JAVA_HOME%\bin

步骤二:安装 Hadoop

  1. 下载 Hadoop 二进制文件

    • 到 Hadoop 官方网站 下载最新的二进制发行版,例如 hadoop-3.3.1.tar.gz
    • 解压缩文件到你的本地目录,例如 C:\hadoop-3.3.1
  2. 配置 Hadoop 环境变量

    • 回到“环境变量”窗口,点击“新建”,然后添加以下内容:

      • 变量名:HADOOP_HOME
      • 变量值:Hadoop 安装路径(例如:C:\hadoop-3.3.1
    • 编辑 Path 变量,在变量值的末尾添加以下内容:%HADOOP_HOME%\bin

  3. 配置 Hadoop Winutils

    • 下载 Hadoop 的 winutils.exe 文件,可以从 GitHub 仓库 找到对应版本。
    • winutils.exe 放到 C:\hadoop-3.3.1\bin 目录下。

步骤三:安装 Apache Spark

  1. 下载 Spark

    • 到 Spark 官方网站 下载预编译的 Spark 版本,例如 spark-3.1.2-bin-hadoop3.2.tgz
    • 解压缩文件到你的本地目录,例如 C:\spark-3.1.2-bin-hadoop3.2
  2. 配置 Spark 环境变量

    • 回到“环境变量”窗口,点击“新建”,然后添加以下内容:

      • 变量名:SPARK_HOME
      • 变量值:Spark 安装路径(例如:C:\spark-3.1.2-bin-hadoop3.2
    • 编辑 Path 变量,在变量值的末尾添加以下内容:%SPARK_HOME%\bin

步骤四:验证安装

  1. 打开命令提示符

    • Win + R 打开“运行”窗口,输入 cmd 并按 Enter
  2. 验证 Java 安装

    • 在命令提示符中输入:java -version
    • 应该显示已安装的 Java 版本。
  3. 验证 Hadoop 安装

    • 在命令提示符中输入:hadoop version
    • 应该显示已安装的 Hadoop 版本。
  4. 验证 Spark 安装

    • 在命令提示符中输入:spark-shell
    • 应该启动 Spark Shell 并显示 Spark 版本和其他信息。

步骤五:运行 Spark 示例

  1. 在命令提示符中
    • 进入 Spark 安装目录,例如:cd C:\spark-3.1.2-bin-hadoop3.2
    • 运行 Spark 示例:bin\spark-submit --class org.apache.spark.examples.SparkPi examples\jars\spark-examples_2.12-3.1.2.jar 10
    • 这将运行 Spark Pi 示例并输出结果。

通过以上步骤,你已经在 Windows 系统上成功安装并配置了 Spark,可以开始进行分布式数据处理和分析任务。如果在安装过程中遇到问题,请确保每一步的环境变量配置和软件版本匹配。

相关文章:

  • 浏览器支持http-flv协议
  • 网络虚拟化考题
  • 番外篇 | YOLOv8算法解析和实战应用:车辆检测 + 车辆追踪 + 行驶速度计算
  • Redis高并发高可用
  • 山东济南比较出名的起名大师的老师,中国最厉害的改名大师颜廷利:短命的小草,年年自损;长寿的大树,万古长青。。。(升命学说)
  • 华为Atlas NPU ffmpeg 编译安装
  • vue 登录
  • Python初体验
  • python 学习积累
  • Syslog日志外发
  • Java宝藏实验资源库(4)对象数组
  • java基于ssm+jsp 高校四六级报名管理系统
  • 数值分析笔记(二)函数插值
  • Docker环境离线安装
  • flask实战之模板实现公共导航
  • Mac M3 Pro 部署Flink-1.16.3
  • 1panel
  • C#程序的递归方法调用
  • 智慧办公新篇章:可视化技术引领园区管理革命
  • Pikachu靶场--XSS
  • 狼雨的网站/b站推广网站2022
  • 中网建站/长沙网络推广外包
  • 比较著名的网站用javaweb做的/关键词优化的最佳方法
  • 泉州网站模板建站/企业网站推广方案设计毕业设计
  • 大连网站建设比较好的公司/免费大数据查询平台
  • 有免费的微网站是什么/营销托管全网营销推广