当前位置: 首页 > wzjs >正文

微信视频网站怎么做的seo免费视频教程

微信视频网站怎么做的,seo免费视频教程,伍佰亿搜索引擎网站系统,电商平台运营方案在Spark 中,cache() 是用于优化计算性能的核心方法之一,但它有许多细节需要深入理解。以下是关于 cache() 的详细技术解析: 1. cache() 的本质 简化的 persist():cache() 是 persist(StorageLevel.MEMORY_ONLY) 的快捷方式&#…

在Spark 中,cache() 是用于优化计算性能的核心方法之一,但它有许多细节需要深入理解。以下是关于 cache() 的详细技术解析:

1. cache() 的本质
简化的 persist():cache() 是 persist(StorageLevel.MEMORY_ONLY) 的快捷方式,将数据以反序列化对象的形式存储在内存中。

惰性操作:调用 cache() 后,数据不会立即缓存,只有在首次触发行动操作(如 count(), show(), collect())时才会执行缓存。

存储级别:默认使用 MEMORY_ONLY,若内存不足,未缓存的分区会在后续需要时重新计算。

2. 底层工作原理
缓存过程
血缘(Lineage)记录:Spark 记录 RDD/DataFrame 的血缘关系(即生成该数据的操作步骤)。

首次计算:当首次触发行动操作时,Spark 根据血缘执行计算,并将结果按分区缓存在内存中。

后续复用:后续操作直接读取缓存数据,跳过血缘中的计算步骤。

缓存失效
手动释放:调用 unpersist() 立即释放缓存。

自动清理:Spark 根据 LRU(最近最少使用)策略自动清理缓存,当内存不足时,最早未使用的缓存分区会被移除。

3. 存储级别的关键细节
cache() 对应的 MEMORY_ONLY 存储级别特性:

特性    说明
序列化    数据以反序列化 Java 对象形式存储,读写速度快,但内存占用高。
内存溢出处理    内存不足时,直接丢弃未缓存的分区,后续需要时重新计算(不会写入磁盘)。
容错性    缓存数据丢失时(如节点故障),Spark 根据血缘重新计算。
4. 何时使用 cache()?
适用场景
重复使用:同一数据集被多次用于不同操作(如多阶段机器学习流水线)。

迭代计算:如 PageRank、梯度下降等需要多次遍历数据的算法。

交互式分析:在 Spark Shell 中多次查询同一数据集。

不适用场景
单次使用:数据仅用一次时,缓存反而浪费资源。

内存不足:数据远大于可用内存时,MEMORY_ONLY 会导致频繁重计算,应改用 MEMORY_AND_DISK。

代码示例
// 使用 cache 的情况

    val cachedRDD = largeRDD.map(complexTransformation).cache()

   

    // 第一次触发行动算子,计算并统计时间

    val startTime3 = System.currentTimeMillis()

    val result3 = cachedRDD.collect()

    val endTime3 = System.currentTimeMillis()

    println(s"使用 cache 第一次计算耗时: ${endTime3 - startTime3} 毫秒")

    // 第二次触发行动算子,计算并统计时间

    val startTime4 = System.currentTimeMillis()

    val result4 = cachedRDD.collect()

    val endTime4 = System.currentTimeMillis()

    println(s"使用 cache 第二次计算耗时: ${endTime4 - startTime4} 毫秒")

    println(s"spark.local.dir 的值: ${conf.get("spark.local.dir")}")

    sc.stop()

http://www.dtcms.com/wzjs/335898.html

相关文章:

  • 中国空间站组成部分seo服务商技术好的公司
  • 如何写网站优化方案上海seo网站优化
  • 葡京网站做中间商优秀企业网站欣赏
  • 繁体网站怎么做郑州网站营销推广
  • 良乡网站建设下载爱城市网app官方网站
  • 学校网站建设规划今日最新的新闻
  • 仿珠宝首饰网站开发seo平台优化
  • 今日广州本地新闻重庆网站seo教程
  • 包头做网站哪家好2022新闻热点10条
  • 网站建设市区重庆百度seo排名优化软件
  • 企业网站服务器建设方法十大教育培训机构排名
  • 做网站销售工资怎么样百度指数关键词工具
  • 如何将aaa云主机做网站百度如何精准搜索
  • 河池网站建设服务各大搜索引擎入口
  • 徐州政府网站手机版精准客户软件
  • 网站建设 工商注册百度统计代码安装位置
  • 阿里云外贸建站网站查询工具
  • 怎样搭建一个网站搜索推广是什么意思
  • 做的好的电商网站重庆网站设计
  • 霍山有没有做建网站的百度推广怎么优化
  • 软件wap网站从事网络营销的公司
  • 有没有专门做网站的怎么做网上销售
  • 江苏省建设资格注册中心网站人民日报新闻
  • 中铁建设集团好进吗重庆seo什么意思
  • 陕西网站开发公司电话百度广告优化师
  • 微信小程序网站模板网站建设黄页
  • 不备案的网站很慢怎么做优化关键词
  • windowxp做网站服务器最好的免费推广平台
  • 返利网网站框架目录关系营销案例
  • 建设旅游网站的工作方案百度2022年版本下载