当前位置: 首页 > news >正文

pyspark测试样例

from pyspark.sql import SparkSession
from pyspark.sql.functions import col, lit, concat

创建 SparkSession

spark = SparkSession.builder.appName(“SparkSQLExample”).getOrCreate()

创建 DataFrame(可以是从 CSV、JSON 等文件读取)

data = [(“Alice”, 586240, 177)] # 注意这里逗号使用的是英文逗号
columns = [“name”, “lac”, “ci”]

df = spark.createDataFrame(data, columns)

创建 CGI 列

df = df.withColumn(
“cgi”,
concat(
lit(“3-”),
(col(“lac”).cast(“integer”) * 256 + col(“ci”).cast(“integer”)).cast(“string”)
)
)

显示结果

df.show()

df = df.withColumn(
“cgi”,
concat(
lit(“3-”),
(col(“lac”).cast(“int”) * 256 + col(“ci”).cast(“int”)).cast(“string”)
)
)

显示结果

df.show()

停止 SparkSession

spark.stop()

样例2:

from pyspark.sql import SparkSession
from pyspark.sql.functions import col, lit, concatspark = SparkSession.builder.appName("SparkSQLExample").getOrCreate()data = [("Alice", 586240, 177)]
columns = ["name", "lac", "ci"]
df = spark.createDataFrame(data, columns)
df = df.withColumn("cgi", concat(lit("3-"), (col("lac").cast("integer") * 256 + col("ci").cast("integer")).cast("string")))
df.show()df = df.withColumn("cgi", concat(lit("3-"), (col("lac").cast("int") * 256 + col("ci").cast("int")).cast("string"))
)# 显示结果
df.show()# 停止 SparkSession
spark.stop()
http://www.dtcms.com/a/200279.html

相关文章:

  • Pytest自动化测试详解
  • GPT/Claude3国内免费镜像站更新 亲测可用
  • uniapp 微信小程序 获取openId
  • 软件架构之-论高并发下的可用性技术
  • React学习———Immer 和 use-immer
  • DDoS与CC攻击:谁才是服务器的终极威胁?
  • 如何快速隔离被攻击的服务器以防止横向渗透
  • ES6详解
  • CSS实现过多的文本进行省略号显示
  • DAY30
  • Spring_Boot(一)Hello spring boot!
  • TDengine 2025年产品路线图
  • 掌握Python编程:从C++/C#/Java开发者到AI与医学影像开发专家
  • PAW3950DM-T5QU游戏级光导航芯片
  • 大模型备案中的安全考量:筑牢数字时代的安全防线
  • Python:操作Excel按行写入
  • 比较两个用于手写体识别的卷积神经网络(CNN)模型
  • 从产品展示到工程设计:3DXML 转 STP 的跨流程数据转换技术解析
  • Compose Kotlin Multiplatform跨平台基础运行
  • kotlin flow的写法
  • 纸上流年:Linux基础IO的文件理解与操作
  • 55. 跳跃游戏
  • 分布式数据库TiDB:深度解析原理、优化与架构设计
  • windows使用ollama部署deepseek及qwen
  • 新能源汽车充电桩管理平台如何利用智慧技术优化资源配置问题?
  • UniApp 实现的文件预览与查看功能#三方框架 #Uniapp
  • Unity入门学习(三)3D数学(3)之Vector3类的介绍
  • kotlin flow的两种SharingStarted策略的区别
  • linux编译安装srs
  • Java(基础)day02 输入、输出、数组、重载、递归