当前位置: 首页 > news >正文

Spark;scp命令,rsync命令,ssh命令

hadoop的运行模式

本地运行:在一台单机上运行,没有分布式文件系统,直接读写本地操作系统的文件系统。特点:不对配置文件进行修改,Hadoop 不会启动 

伪分布式:也是在一台单机上运行,但用不同的 Java 进程模仿分布式运行中的各类节点,特点:Hadoop 启动的这些守护进程都在同一台机器上运行,是相互独立的 Java 进程。

完全分布式:数据存储在HDFS,多台服务器工作,企业中大量使用

scp命令

scp命令 :可实现服务器与服务器之间的数据拷贝

-r 表示递归拷贝

$pdir/$fname :要拷贝的文件路径 / 名称

$user@host:$pdir/$fname :目的地用户@主机:目的地路径 / 名称 

eg命令:scp -r /opt/module/jdk1.8.0_212/ root@hadoop102:/opt/module/jdk1.8.0_212/

rsync命令

rsync 主要用于备份和镜像

rsync和scp的区别是rsync只对差异文件做更新,而scp是把所有文件都复制过去。故rsync效率更高

-a :归档拷贝,尽可能让拷贝的

-v :显示拷贝过程

$pdir/$fname :要拷贝的文件路径 / 名称

命令:rsync -av /opt/conf/1.txt root@roothadoop102:/opt/conf/
 

xsync脚本集群之间的同步

(1)在/root/bin目录下创建xsync文件。

(2)在该文件中编写如下代码。这个部分的代码不需要会写,能看懂,了解即可。

#!/bin/bash
#1. 判断参数个数
if [ $# -lt 1 ]
then
    echo Not Enough Arguement!
    exit;
fi
#2. 遍历集群所有机器
for host in hadoop100 hadoop101 hadoop102
do
    echo ====================  $host  ====================
    #3. 遍历所有目录,挨个发送
    for file in $@
    do
        #4. 判断文件是否存在
        if [ -e $file ]
            then
                #5. 获取父目录
                pdir=$(cd -P $(dirname $file); pwd)
                #6. 获取当前文件的名称
                fname=$(basename $file)
                ssh $host "mkdir -p $pdir"
                rsync -av $pdir/$fname $host:$pdir
            else
                echo $file does not exists!
        fi
    done
done

 (3)修改执行权限。此时,我们去查看文件,可以看到它的颜色是灰色的,不具备执行权限(如下图)。

接下来要通过命令: chmod +x xsync(或者是chmod 777 xsync)

重新查看它的颜色,绿色即可执行,它现在已经变成执行的脚本了(如上右图)。

(4)测试使用。把这个脚本同步到其他的机器中。

[root@hadoop100 ~]$ xsync /root/bin/

ssh命令

ssh命令无需密码也可登录

eg:目标:hadoop100通过ssh访问hadoop101,hadoop102时不需要密码,其他两台设备也类似。

具体操作如下:

1.在hadoop100中生成公钥和密码。ssh-keygen -t rsa 三次回车

2.在hadoop100中,把自己的公钥传递给hadoop101,hadoop102。命令如下

        ssh-copy-id hadoop101

        ssh-copy-id hadoop102

hadoop101 无密登录 hadoop100,hadoop102 与(1)类似

hadoop102 无密登录 hadoop100,hadoop101 与(1)类似

eg:从hadoop100进入hadoop101的命令就是

        ssh root@hadoop102

        退出命令就是:exit

相关文章:

  • 技术解析与实战指南:MySQL性能优化与高效数据库迁移工具推荐
  • 深度剖析《数理化学习》期刊:数理化教育领域的学术明珠
  • JAVA使用jar包外前端
  • 统一 Elastic 向量数据库与 LLM 功能,实现智能查询
  • 文档在线协同工具ONLYOFFICE教程:如何使用宏对 PDF 表单中的特定字段执行计算
  • 设计模式之美
  • LeetCode-移动零
  • 如何配置Socks5代理
  • 56.HarmonyOS NEXT 登录模块开发教程(十):总结与展望
  • 游戏引擎学习第156天
  • [leetcode] 面试经典 150 题——篇1:数组/字符串
  • 【redis】redis的单线程模型为什么效率高?
  • 为什么使用 XML Schema?
  • Linux websocket服务器、配网方法、QT客户端程序
  • deepseek+kimi做ppt教程记录
  • 我的创作纪念日 打造高效 Python 日记本应用:从基础搭建到功能优化全解析
  • 深度学习篇---Opencv中的Haar级联分类器
  • 【Python运维】用Python编写云服务监控工具:实时监测和报警
  • Android 列表页面终极封装:SmartRefreshLayout + BRVAH 实现下拉刷新和加载更多
  • PGSQL基本使用
  • 东莞做网站it s/竞价推广是做什么的
  • 怎么在一个网站做编辑/seo是什么服
  • 个人是否可以做网站/网站域名综合查询
  • 可以做网络推广的网站/免费私人网站建设软件
  • wordpress视频网站模板下载/上海推广网站
  • 网站建设策划书选题/福建百度代理公司