当前位置: 首页 > news >正文

网站seo教程在线广告设计制作

网站seo教程,在线广告设计制作,不注册公司可以做网站吗,网页布局的基础(一)需求说明 准备十条符合包含用户信息的文本文件,每行格式为 姓名,年龄,性别,需要清洗掉年龄为空或者非数字的行。 例如: 张三,25,男 李四,,女 王五,30,男 赵六,a,女 孙七,35,男 周八,40,女 吴九,abc,男 郑十,45,女…
需求说明

准备十条符合包含用户信息的文本文件,每行格式为 姓名,年龄,性别,需要清洗掉年龄为空或者非数字的行

例如:

张三,25,男

李四,,女

王五,30,男

赵六,a,女

孙七,35,男

周八,40,女

吴九,abc,男

郑十,45,女

王十,50,男

李二,55,女

思路分析

  1. 读入文件
  2. 对每一行数据进行分析
    1. 字段拆分,拆分出年龄这个字段
    2. 判断
      • 如果它不是数字或者缺失,则忽略这条数据
      • 否则保存

(三) 代码展示

import org.apache.spark.{SparkConf, SparkContext}

object DataCleaning {

  def main(args: Array[String]): Unit = {

    // 创建 SparkConf 对象

    val conf = new SparkConf().setAppName("DataCleaning").setMaster("local[*]")

    // 创建 SparkContext 对象

    val sc = new SparkContext(conf)

 

    // 读取文本文件,创建 RDD

    val inputFile = "input/file.txt"

    val lines = sc.textFile(inputFile)

 

    // 数据清洗操作

    val cleanedLines = lines.filter(line => { // 使用filter算子

      val fields = line.split(",")

      if (fields.length == 3) {

        val age = fields(1).trim

        age.matches("\\d+")

      } else {

        false

      }

    })
      // 输出清洗后的数据
       cleanedLines.collect().foreach(println)

 

    // 停止 SparkContext

    sc.stop()

  }

}

拓展:如何把清洗之后的数据保存到一个文件中。

可以使用coalesce(1)这个方法可以让结果全部保存在一个文件中。

代码如下:

val singlePartitionRDD = cleanedLines.coalesce(1)

    // 保存清洗后的数据到文件

    val outputPath = "path/to/your/output/file.txt"

    singlePartitionRDD.saveAsTextFile(outputPath)

    // 停止 SparkContext

    sc.stop()

http://www.dtcms.com/a/435418.html

相关文章:

  • 【自然语言处理】文本表示知识点梳理与习题总结
  • 嘉兴网站建设低价推荐制作企业网站步骤
  • 电容器充放电原理
  • 数组与字典解决方案第三十讲:如何将记录集的数据记入数组
  • 互联网网站建设价格中山如何建设网站
  • 提供网站建设制作做网站攻略
  • 北京seo网站诊断一个人做网站时间
  • 【密码学实战】openHiTLS enc命令行:数据加解密
  • 做网站汉狮网络wordpress多站点
  • Android 四大组件全面解析
  • 【读书笔记】《C陷阱与缺陷》第7章:可移植性陷阱解析 | 编写跨平台C程序
  • 成都专业做网站公司展示型网站案例
  • 大语言模型中的“推理”:基本原理与实现机制解析
  • 成都网站营销推广公司十大网游人气排行榜
  • 单北斗GNSS在桥梁和地质灾害中的变形监测应用与技术发展
  • 郑州网站顾问网上有做logo的网站吗
  • 企业电子商务网站平台建设百度竞价广告的位置
  • 第三类笔记
  • 深圳做律师网站公司百度联盟的网站怎么做
  • Netflix 推荐系统 | 从百万美元挑战赛到个性化体验升级的技术演进
  • 安徽省建设干部学校网站玉林博白网站建设
  • 关于GESP8级题目有疑问
  • JVM参数速查
  • STM32定时器的整体概述
  • AI-调查研究-92-具身智能 机器人运动控制全解析:从传统模型到深度学习方法
  • 河南和城乡建设厅网站军队采购网
  • Sql 优化篇大全,干货
  • 类似于美团的网站怎么做的wordpress4.8.3
  • 今日分享 位运算
  • 【Java EE】MyBatis 全面详解