当前位置: 首页 > wzjs >正文

soho建网站 必须先注册公司吗孝感seo

soho建网站 必须先注册公司吗,孝感seo,有平面广告设计的网站,冷门不重名的公司名称🧠 1. 什么是伪分布式模式(Pseudo-distributed Mode)? 在 Hadoop 中,伪分布式模式是一种 用一台机器模拟多节点集群 的运行方式。 每个 Hadoop 组件(如 NameNode、DataNode、ResourceManager、NodeManager&…

🧠 1. 什么是伪分布式模式(Pseudo-distributed Mode)?

在 Hadoop 中,伪分布式模式是一种 用一台机器模拟多节点集群 的运行方式。

  • 每个 Hadoop 组件(如 NameNode、DataNode、ResourceManager、NodeManager)都在 独立的 Java 进程中运行

  • 适合做开发、调试、学习使用。

简单来说:“一台电脑,装扮成一群电脑”


🔁 2. 什么是 MapReduce?

MapReduce 是一种用于大数据处理的编程模型,由两个阶段组成:

阶段作用说明
Map对数据进行切分处理,比如统计每个词出现一次
Reduce对中间结果合并,比如把相同的词频加总

经典例子是:统计一篇文章中每个单词出现了几次(WordCount)


🔧 3. 开始运行 WordCount 示例程序

我们使用的是 Hadoop 自带的 MapReduce 示例程序:hadoop-mapreduce-examples-3.3.4.jar
里面包括了经典的应用程序,比如:wordcount, grep, pi 等。


🪜 步骤一:查看有哪些示例程序

$ hadoop jar /usr/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.4.jar

📌 这条命令会列出 JAR 包里的所有示例,比如:

  • wordcount:统计词频

  • grep:用正则表达式匹配文本

  • pi:估算圆周率


🪜 步骤二:查看 wordcount 的用法

$ hadoop jar /usr/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.4.jar wordcount

你会看到提示:

Usage: wordcount <input> <output>

说明它需要两个参数:

  1. 输入路径(input):HDFS 上的目录,里面放文本文件

  2. 输出路径(output):结果存储的目录(注意不能事先存在)


🪜 步骤三:准备环境

✅ 1)启动 HDFS 和 YARN

$ start-dfs.sh $ start-yarn.sh
  • start-dfs.sh 启动分布式文件系统(NameNode、DataNode)

  • start-yarn.sh 启动任务调度系统(ResourceManager、NodeManager)

✅ 2)创建用户目录(如果没建过)

$ hdfs dfs -mkdir -p /user/user

这一步是给你在 HDFS 上建一个“个人文件夹”。


🪜 步骤四:上传输入文件

✅ 创建输入目录并上传文件:

$ hdfs dfs -mkdir input$ hdfs dfs -put text.txt input
  • mkdir input 是在 HDFS 上建一个 input 文件夹

  • put text.txt input 把本地的 text.txt 文件上传进去


🪜 步骤五:运行 WordCount 程序!

$ hadoop jar /usr/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.4.jar wordcount input output
  • 输入目录是 input

  • 输出目录是 output

  • 程序会在后台运行 Map 和 Reduce 任务,统计每个单词的出现次数。


🪜 步骤六:查看结果

✅ 方法一:下载输出结果到本地

$ hdfs dfs -get output/part-* $ cat part-r-00000
  • part-r-00000 是 Reduce 阶段的输出文件。

  • 里面是每个单词及其频率,比如:

a 5 and 3 hadoop 10


✅ 方法二:直接在终端查看输出内容

$ hdfs dfs -cat output/part-*

 

 

 

 


⚠️ 常见错误:输出目录已存在!

如果你再次运行程序,而 output 文件夹还存在,就会报错。

🧹 解决方案一:删掉旧的输出目录

$ hdfs dfs -rm -r output

🧳 解决方案二:用新的输出目录

比如:

$ hadoop jar ... wordcount input output2$ hdfs dfs -cat output2/part-*

✅ 总结流程图(简化)

Step 1: 启动 Hadoop → start-dfs.sh → start-yarn.shStep 2: 准备数据 → 上传 text.txt 到 HDFS 的 input 文件夹Step 3: 运行程序 → hadoop jar ... wordcount input outputStep 4: 查看结果 → cat output/part-*

✅ 一句话总结

Hadoop 的 MapReduce 示例程序(如 wordcount)能在伪分布式模式中运行,读取 HDFS 上的文本文件,统计词频,并将结果保存到 HDFS 的输出目录中。

http://www.dtcms.com/wzjs/454721.html

相关文章:

  • 网站建设优化收费宁德市区哪里好玩
  • 常平网站建设网络推广的主要工作内容
  • 西宁市建设委员会网站苏州网站优化公司
  • 十大个人博客网站深圳做seo有哪些公司
  • wordpress 加盟主题界首网站优化公司
  • 别人帮做的网站到期续费cnn头条新闻
  • 网站如何添加图标seo标题优化步骤
  • 羽贝网站建设重庆森林为什么叫这个名字
  • 做B2B网站需要办理什么dz论坛seo
  • 外汇期货喊单网站怎么做的有哪些免费网站可以发布广告
  • 网站数据库有哪些宁波seo网页怎么优化
  • 中文域名和网站的关系网站建设与网页设计制作
  • 网站建设程序流程线上培训机构排名前十
  • 做两个一摸一样的网站网络公司排名
  • 公司做网站费用记到哪个科目sem是什么的英文缩写
  • 金坛网站建设价格百度提交网站收录查询
  • 太原优化网站信阳网站seo
  • 怎么才能注册做网站首页关键词优化价格
  • 建e全景效果图无锡网站seo顾问
  • wordpress小人插件百度关键词优化多久上首页
  • 自媒体平台企业网站怎么设置百度网页版浏览器入口
  • wordpress适合做什么网站国内免费顶级域名注册
  • 高端工作网站网站域名备案信息查询
  • 做竞价的网站做优化有效果吗谷歌推广哪家公司好
  • 茶叶建设网站的优势百度一下百度官网
  • 专门做视频的网站计算机培训班培训费用
  • 太原市建设局网站首页搜索引擎排名国内
  • 做网站为什么要买网站空间品牌推广文案
  • 网站建设套餐是什么意思百度的客服电话是多少
  • 做班级网站的实训报告下载百度安装