当前位置: 首页 > news >正文

Anaconda中配置Pyspark的Spark开发环境

Anaconda中配置Pyspark的Spark开发环境

目录

    • 1.在控制台中测试ipython是否启动正常
    • 2.安装好Java
    • 3.安装Spark并配置环境变量
    • 4.PySpark配置
    • 5.修改spark\conf下的spark-env文件
    • 6.测试Pyspark是否安装成功

1.在控制台中测试ipython是否启动正常

anaconda正常安装

这里先检查ipython是否正常,cmd命令窗口,输入,ipython,如下就证明可用。
在这里插入图片描述

2.安装好Java

测试
在这里插入图片描述

3.安装Spark并配置环境变量

spark 官网地址:https://spark.apache.org/downloads.html

选择需要的版本后安装
在这里插入图片描述
在这里插入图片描述

解压:

在这里插入图片描述
配置环境变量

在这里插入图片描述
添加到Path:
在这里插入图片描述

4.PySpark配置

在这里插入图片描述
在这里插入图片描述

增加:

%SPARK_HOME%\python\lib\py4j;%SPARK_HOME%\python\lib\pyspark; 

在这里插入图片描述

5.修改spark\conf下的spark-env文件

在这里插入图片描述

这里路径,写自己的anaconda路径

export PYSPARK_PYTHON=/C:/ProgramData/anaconda3
export PYSPARK_DRIVER_PYTHON=/C:/ProgramData/anaconda3
export PYSPARK_SUBMIT_ARGS=‘–master local[*]’

在这里插入图片描述

拷贝pyspark到site-packages文件夹下

在这里插入图片描述
拷贝到自己的anaconda文件下:

在这里插入图片描述

6.测试Pyspark是否安装成功

输入

jupyter notebook

在这里插入图片描述
在这里插入图片描述

from pyspark import SparkContext,SparkConfconf = SparkConf()data = ["猪八戒","20001"]sc = SparkContext(conf = conf)rdd = sc.parallelize(data)print(rdd.collect())

在这里插入图片描述

相关文章:

  • 【中间件】bthread_数据结构_学习笔记
  • terraform 删除资源前先校验资源是否存在关联资源
  • AJAX 实例
  • 【Linux】线程池和线程补充内容
  • Qwen3 正式发布
  • C++——入门基础(2)
  • 工 厂 模 式
  • 游戏引擎学习第252天:允许编辑调试值
  • 企业内训|智能驾驶与智能座舱技术——某汽车厂商
  • 【Qt】网络
  • Python项目源码69:Excel数据筛选器1.0(tkinter+sqlite3+pandas)
  • 《数据结构初阶》【顺序表/链表 精选15道OJ练习】
  • 【数据结构】- 栈
  • 文件操作--文件包含漏洞
  • 如何让Steam下载速度解除封印?!
  • PyTorch线性代数操作详解:点积、矩阵乘法、范数与轴求和
  • 字符串转换整数(atoi)(8)
  • 在阿里云 Ubuntu 24.04 上部署 RabbitMQ:一篇实战指南
  • 【进阶】--函数栈帧的创建和销毁详解
  • Spring MVC 与 FreeMarker 整合
  • 《一鸣惊人》五一特别节目:以戏曲为桥梁,展现劳动者的坚守
  • 国际油价重挫!美股道指连跌三月,啥情况?
  • 五大光伏龙头一季度亏损超80亿元,行业冬天难言结束
  • 山西太原小区爆炸事故已造成17人受伤
  • 金砖国家外长会晤发表主席声明,强调南方国家合作
  • 国家统计局:一季度全国规模以上文化及相关产业企业营业收入增长6.2%