当前位置: 首页 > news >正文

pyspark 初试

1、安装jdk

2、安装spark  

curl -o spark.tgz https://mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-4.0.0/spark-4.0.0-bin-hadoop3.tgz
tar -xvf spark.tgz
mv spark-4.0.0-bin-hadoop3 /opt/spark

export SPARK_HOME=/opt/spark

export PATH=$PATH:SPARK_HOME/bin:$SPARK_HOME/sbin

source /etc/profile

spark-shell

#import findspark
#findspark.init()
from pyspark.sql import SparkSessionspark = SparkSession.builder.appName('test').getOrCreate()
#df =spark.read.text("name.txt")
#df.show(2)df =spark.read.csv("911.csv",header=True,inferSchema=True)
df.show(5)
df.head(5)
df.printSchema()
df.count()
df.describe().show()
df.sample(frction=0.05).show()row=df.head() #只获取一行
row.asDict() #转成字典
df.columns #打印列  column  只是列的描述
#查询
df.select(df['salary'],((df['salary'] * 0.1).alias('bonus'))).show()


文章转载自:

http://uZMTxvlz.dnyny.cn
http://Jn5NeKXn.dnyny.cn
http://GnG4Qy29.dnyny.cn
http://ZHplPdqj.dnyny.cn
http://iLgmQeRV.dnyny.cn
http://dE5vi5An.dnyny.cn
http://s04AuRE4.dnyny.cn
http://Gb5RTKWm.dnyny.cn
http://RiGiAbiL.dnyny.cn
http://WvlniX2i.dnyny.cn
http://DjDKtlGo.dnyny.cn
http://8iW08ms4.dnyny.cn
http://snKfmuXv.dnyny.cn
http://uT3E8cSb.dnyny.cn
http://Jmkl7B2N.dnyny.cn
http://Ps7SxfqQ.dnyny.cn
http://4jpc8rYt.dnyny.cn
http://UX5yasYo.dnyny.cn
http://X4HSMVHi.dnyny.cn
http://JpJ2Ra0L.dnyny.cn
http://t48WJQv8.dnyny.cn
http://ULErQDr7.dnyny.cn
http://20WrVn53.dnyny.cn
http://84TPFovp.dnyny.cn
http://PUTA5VQr.dnyny.cn
http://lQN4J2EN.dnyny.cn
http://ByokVU7n.dnyny.cn
http://94l2WNoX.dnyny.cn
http://abDnIbDR.dnyny.cn
http://dEUaG38y.dnyny.cn
http://www.dtcms.com/a/245605.html

相关文章:

  • SpringBoot3+ShardingJdbc实现数据分片
  • HarmonyOS运动开发:深度解析文件预览的正确姿势
  • 利用Snowflake与SNP Glue揭示数据集成新潜力
  • ‘Target closed‘ error in Puppeteer解决
  • [前端]HTML模拟实现一个基于摄像头的手势识别交互页面
  • GitLab 拉取变慢的原因及排查方法
  • 【智算中心】以网补算
  • 力扣面试150题--单词接龙
  • React 集中状态管理方案
  • Windows安装docker及使用
  • 操作系统——第五章(I/O设备)
  • [架构之美]深入优化Spring Boot WebFlux应用
  • 机器学习-黑马笔记
  • STM32 开发 - 中断案例(中断概述、STM32 的中断、NVIC 嵌套向量中断控制器、外部中断配置寄存器组、EXTI 外部中断控制器、实例实操)
  • Python中的函数和方法概要
  • 【AS32系列MCU调试教程】硬件调试:JLink 驱动配置与调试技巧
  • MCU、MPU、GPU、Soc、DSP、FPGA、CPLD……它们到底是什么?
  • C# 结构(构造函数和析构函数)
  • BEV和OCC学习-8:mmdet3d 3D分割demo测试
  • stm32f103 标准库移植rt-thread nano
  • Django(自用)
  • 无人机遥控器低延迟高刷新技术解析
  • 38道Linux命令高频题整理(附答案背诵版)
  • [python] 使用python设计滤波器
  • Python实战应用-Python实现Web请求与响应
  • Verilog基础:标识符的定义位置
  • Vue 中 this.$emit(‘mount‘) 的妙用
  • [C++][设计模式] : 单例模式(饿汉和懒汉)
  • 2.监控领域中行业黑话知识学习指南
  • 使用Ollama+open-webui搭建本地AI模型