当前位置: 首页 > wzjs >正文

eclipse网站开发流程有关西安的网页设计

eclipse网站开发流程,有关西安的网页设计,岳阳网站推广,广安网站建设兼职基本概念 Apache Spark 是一个专为大规模数据处理而设计的快速、通用的计算引擎。它最初由加州大学伯克利分校的 AMP 实验室开发,后成为 Apache 顶级项目。Spark 采用内存计算,可将作业中间结果缓存于内存中,减少磁盘读写操作,在…

基本概念

Apache Spark 是一个专为大规模数据处理而设计的快速、通用的计算引擎。它最初由加州大学伯克利分校的 AMP 实验室开发,后成为 Apache 顶级项目。Spark 采用内存计算,可将作业中间结果缓存于内存中,减少磁盘读写操作,在数据挖掘和机器学习等需要迭代计算的场景中表现出色。

核心组件

Spark 的核心组件包括:

  • Spark Core :实现了 Spark 的基本功能,如 RDD(弹性分布式数据集)、任务调度、内存管理等,是 Spark 的基础。

  • Spark SQL :用于操作结构化数据的程序包,支持 SQL 查询,能够与多种数据源集成,如 Hive、Avro、Parquet 和 JSON 等。

  • Spark Streaming :提供了对实时数据进行流式计算的组件,可处理来自多种数据源的实时数据流,如 Kafka、Flume 和 TCP 套接字。

  • MLlib :是 Spark 提供的机器学习功能的程序库,包含常见的机器学习算法,如分类、回归、聚类和推荐系统等。

  • GraphX :用于图计算的 API,适用于大规模图数据计算,支持常见的图算法,如 PageRank、连接组件和最短路径等。

安装部署

需要说明的是:Spark的image有官方版本和第三方版本(vmware的bitnami/spark等);官方版本在不使用Kubernetes的情况下,使用Docker无法以服务启动,只能进行交互式访问。

官方版启动命令:

ENTRYPOINT ["/opt/entrypoint.sh"]

bitnami/spark镜像启动命令:

ENTRYPOINT ["/opt/bitnami/scripts/spark/entrypoint.sh"]

官方镜像使用

拉取镜像:docker pull spark

链接:https://hub.docker.com/r/spark

Interactive Scala Shell

docker run -it spark /opt/spark/bin/spark-shell

Interactive Python Shell

docker run -it spark:python3 /opt/spark/bin/pyspark

Interactive R Shell

docker run -it spark:r /opt/spark/bin/sparkR

运行如下命令调用,返回:Long = 1000000000      

>>> spark.range(1000 * 1000 * 1000).count()

退出scala:

scala> :quit

bitnami/spark镜像使用

拉取镜像:docker pull bitnami/spark:3.5.5

链接:https://hub.docker.com/r/bitnami/spark 

环境准备
useradd spark
usermod -a -G docker spark
su - spark
mkdir -p ~/spark-cluster/{conf,data,ivy}
chmod 777 ~/spark-cluster/{conf,data,ivy}

注:这里需要完全放开权限,否则spark启动失败,镜像中使用了root组的rpmer用户拷贝文件到上述目录中。

定义docker-compose yaml规格文件
cd spark-cluster/cat >docker-compose.yaml <<EOF
services: master:image: bitnami/spark:3.5.5container_name: spark-masterports:- "8080:8080"- "7077:7077"environment:- SPARK_MODE=master- SPARK_MASTER_HOST=spark-master- SPARK_RPC_AUTH_ENABLED=novolumes:- ./conf:/opt/bitnami/spark/conf- ./data:/data- ./ivy:/opt/bitnami/spark/ivynetworks:- zookeeper-networker1:image: bitnami/spark:3.5.5container_name: spark-worker1environment:- SPARK_MODE=worker- SPARK_MASTER_URL=spark://spark-master:7077- SPARK_WORKERMEMORY=2G- SPARK_WORKER_CORES=1- SPARK_RPC_AUTH_ENABLED=novolumes:- ./conf:/opt/bitnami/spark/conf- ./data:/data- ./ivy:/opt/bitnami/spark/ivydepends_on:- masternetworks:- zookeeper-networker2:image: bitnami/spark:3.5.5container_name: spark-worker2environment:- SPARK_MODE=worker- SPARK_MASTER_URL=spark://spark-master:7077- SPARK_WORKERMEMORY=2G- SPARK_WORKER_CORES=1- SPARK_RPC_AUTH_ENABLED=novolumes:- ./conf:/opt/bitnami/spark/conf- ./data:/data- ./ivy:/opt/bitnami/spark/ivydepends_on:- masternetworks:- zookeeper-netnetworks:zookeeper-net:external: true
EOF

注:我这里使用了已有的docker network:zookeeper-net,如果没有需要创建,或者修改docker-compose为已有network。

启动spark
docker-compose up -d

验证 Spark 运行状态

访问 Spark Master 的 Web UI,查看集群状态。默认情况下,Master 的 Web UI 运行在 8080 端口,可以通过以下命令查看:

curl http://localhost:8080

也可以直接浏览器访问:

日志查看

docker-compose logs master worker1 worker2

提交 Spark 作业

docker exec -it spark-master /bin/bash
spark-submit --master spark://spark-master:7077 \--class org.apache.spark.examples.SparkPi \ $SPARK_HOME/examples/jars/spark-examples_2.12-3.5.5.jar 10

报错:
Exception in thread "main" java.lang.IllegalArgumentException: basedir must be absolute: ?/.ivy2/local at org.apache.ivy.util.Checks.checkAbsolute(Checks.java:48)

解决:

1、echo "spark.jars.ivy /opt/bitnami/spark/ivy" >> conf/spark-defaults.conf

2、重启spark

docker-compose down -v

docker-compose up -d

3、再次提交作业,成功完成。

http://www.dtcms.com/wzjs/538121.html

相关文章:

  • 如何做网站menu菜单广告传媒公司是做什么的
  • 图片生成器网站企业网站推广哪家公司好
  • 北京建公司网站价格创办一个网站
  • 网络营销的核心是用户吗成都网站seo
  • 做网站在线咨询大学生网站建设策划书范文
  • 站长之家官网入口微网站开发入门
  • 用dw做网站 的过程我厂有大量手工活外发加工
  • intitlt:山西大同网站建设如何建立网址
  • 个人网站建设方案书销售网站的优秀标准
  • 一个网站的后台怎样查看网站的权重
  • 上海seo网站优化淄博网站建设选择臻动传媒
  • 湖北省建设招投标监督机构网站黑马教育培训官网
  • 妹妹强迫我和她做网站应用市场下载安装app
  • 梅州网站优化公司网站建设要多久
  • 做html5网站衡水淘宝的网站建设
  • 免费建站网站一级123456炒币网站开发
  • 专业建站网站服务销售课程培训视频教程
  • 学习网站建设要什么学历windows版本的wordpress
  • 整站seo服务知名的crm管理系统
  • 三只小猪的题目登网站做wordpress 搜索 自定义字段
  • 百度站长平台工具wordpress上传漏洞
  • 网站推广在哪好昌平电子网站建设
  • 做网站入什么会计科目台州做网站seo的
  • 外贸企业网站制作哪家好年度关键词
  • 做剧情游戏的网站站长工具seo综合查询怎么看数据
  • 江苏伟业建设集团网站网站建设模板是什么
  • 做网站卖印度药2015做哪些网站致富
  • 兰州 网站建设公司哪家好网站建设数据库系统
  • 网络网站开发设计用Python做网站如何配置域名
  • 做网站需要服务器网站优化排名软件推广