当前位置: 首页 > news >正文

Anaconda中配置Pyspark的Spark开发环境

Anaconda中配置Pyspark的Spark开发环境

目录

    • 1.在控制台中测试ipython是否启动正常
    • 2.安装好Java
    • 3.安装Spark并配置环境变量
    • 4.PySpark配置
    • 5.修改spark\conf下的spark-env文件
    • 6.测试Pyspark是否安装成功

1.在控制台中测试ipython是否启动正常

anaconda正常安装

这里先检查ipython是否正常,cmd命令窗口,输入,ipython,如下就证明可用。
在这里插入图片描述

2.安装好Java

测试
在这里插入图片描述

3.安装Spark并配置环境变量

spark 官网地址:https://spark.apache.org/downloads.html

选择需要的版本后安装
在这里插入图片描述
在这里插入图片描述

解压:

在这里插入图片描述
配置环境变量

在这里插入图片描述
添加到Path:
在这里插入图片描述

4.PySpark配置

在这里插入图片描述
在这里插入图片描述

增加:

%SPARK_HOME%\python\lib\py4j;%SPARK_HOME%\python\lib\pyspark; 

在这里插入图片描述

5.修改spark\conf下的spark-env文件

在这里插入图片描述

这里路径,写自己的anaconda路径

export PYSPARK_PYTHON=/C:/ProgramData/anaconda3
export PYSPARK_DRIVER_PYTHON=/C:/ProgramData/anaconda3
export PYSPARK_SUBMIT_ARGS=‘–master local[*]’

在这里插入图片描述

拷贝pyspark到site-packages文件夹下

在这里插入图片描述
拷贝到自己的anaconda文件下:

在这里插入图片描述

6.测试Pyspark是否安装成功

输入

jupyter notebook

在这里插入图片描述
在这里插入图片描述

from pyspark import SparkContext,SparkConfconf = SparkConf()data = ["猪八戒","20001"]sc = SparkContext(conf = conf)rdd = sc.parallelize(data)print(rdd.collect())

在这里插入图片描述

http://www.dtcms.com/a/166837.html

相关文章:

  • 【中间件】bthread_数据结构_学习笔记
  • terraform 删除资源前先校验资源是否存在关联资源
  • AJAX 实例
  • 【Linux】线程池和线程补充内容
  • Qwen3 正式发布
  • C++——入门基础(2)
  • 工 厂 模 式
  • 游戏引擎学习第252天:允许编辑调试值
  • 企业内训|智能驾驶与智能座舱技术——某汽车厂商
  • 【Qt】网络
  • Python项目源码69:Excel数据筛选器1.0(tkinter+sqlite3+pandas)
  • 《数据结构初阶》【顺序表/链表 精选15道OJ练习】
  • 【数据结构】- 栈
  • 文件操作--文件包含漏洞
  • 如何让Steam下载速度解除封印?!
  • PyTorch线性代数操作详解:点积、矩阵乘法、范数与轴求和
  • 字符串转换整数(atoi)(8)
  • 在阿里云 Ubuntu 24.04 上部署 RabbitMQ:一篇实战指南
  • 【进阶】--函数栈帧的创建和销毁详解
  • Spring MVC 与 FreeMarker 整合
  • OpenGL-ES 学习(10) ---- OpenGL-ES Shader语言语法
  • 健康生活新主张:全方位养生指南
  • WPF嵌入webapi服务器,充当微服务角色
  • 人工智能的前世今生
  • IRF2.0IRF3.1
  • 基于开源链动2+1模式AI智能名片S2B2C商城小程序的个性化与小众化消费社群构建研究
  • Spring Boot 使用 WebMagic 爬虫框架入门
  • 利用无事务方式插入数据库解决并发插入问题
  • 深入解析 .NET Kestrel:高性能 Web 服务器的架构与最佳实践
  • 论文笔记——QWen2.5 VL