当前位置: 首页 > wzjs >正文

虚拟空间官网discuz论坛seo设置

虚拟空间官网,discuz论坛seo设置,重庆网站建设有名 乐云践新,营销型网站的三大特点在IDEA中去创建项目,并编写java代码来操作集群中的文件 1.IDEA 中创建 Maven 项目 步骤一:点击 File -> New -> Project,在弹出的窗口左侧选择 Maven,点击 Next: 步骤二:填写项目的 GroupId、Arti…

在IDEA中去创建项目,并编写java代码来操作集群中的文件

1.IDEA 中创建 Maven 项目

步骤一:点击 File -> New -> Project,在弹出的窗口左侧选择 Maven,点击 Next:

步骤二:填写项目的 GroupId、ArtifactId、Version 等信息(这些对应 pom.xml 中的关键配置),点击 Next。

步骤三:确认项目配置信息无误后,点击 Finish,IDEA 会自动生成 Maven 项目结构。

2.IDEA 中配置 Maven(使用自定义 Maven 版本示例)

步骤一:打开 IDEA,点击 File -> Settings(Windows/Linux)或者 IntelliJ IDEA -> Preferences(Mac),进入设置界面,然后找到 Build, Execution, Deployment -> Build Tools -> Maven。

步骤二:在 Maven home directory 处,点击右侧的按钮,选择你本地安装的 Maven 目录,例如:

步骤三:可以在 User settings file 中指定 settings.xml 文件的路径(一般使用默认路径即可),Local repository 中指定本地仓库的路径,配置完成后点击 OK 保存设置。

3.Maven打包

MapReduce是一个分布式运算程序的编程框架,是用户开发“基于Hadoop的数据分析应用”的核心框架。

MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序(例如:jar包),并发运行在一个Hadoop集群上。

在pom.xml中,补充如下配置,它用来设置打包的java 版本。

<properties><maven.compiler.source>1.8</maven.compiler.source><maven.compiler.target>1.8</maven.compiler.target><project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
</properties>

注:我们集群上安装的java环境是1.8的,那么我们生成的代码也必须是这个版本的,否则,就会无法运行

2.修改代码,设置执行环境和文件路径

我们集群上安装的java环境是1.8的,那么我们生成的代码也必须是这个版本的,否则,就会无法运行。

打开代码,找到driver类,并修改如下:

conf.set("fs.defaultFS", "hdfs://hadoop100:8020"); // 新增加一句
FileInputFormat.setInputPaths(job, new Path("/wcinput")); // 修改
FileOutputFormat.setOutputPath(job, new Path("/output1"));

3.上传到节点运行
使用finalshell上到任意节点,例如hadoop100上的/opt下,。

然后通过命令来执行执行WordCount程序,注意要写Driver类的全名

$ hadoop jar  /opt/wc.jarcom.root.mapreduce.wordcount.WordCountDriver

运行结束之后,在ui中查看yarn运行效果。

4.修改执行参数
修改代码,让程序能指定要执行的输入目录和要保存结果的输出目录。

修改driver类的代码,更新输入和输入路径。

// 6. 设置输入和输出路径路径为程序的第一个参数,第二个参数FileInputFormat.setInputPaths(job, new Path(args[0]));FileOutputFormat.setOutputPath(job, new Path(args[1]));

优点:

(1)MapReduce易于编程

它简单的实现一些接口,就可以完成一个分布式程序,这个分布式程序可以分布到大量廉价的PC机器上运行。也就是说你写一个分布式程序,跟写一个简单的串行程序是一模一样的。就是因为这个特点使得MapReduce编程变得非常流行。

(2)良好的扩展性

当你的计算资源不能得到满足的时候,你可以通过简单的增加机器来扩展它的计算能力。

(3)高容错性

MapReduce设计的初衷就是使程序能够部署在廉价的PC机器上,这就要求它具有很高的容错性。比如其中一台机器挂了,它可以把上面的计算任务转移到另外一个节点上运行,不至于这个任务运行失败,而且这个过程不需要人工参与,而完全是由Hadoop内部完成的。

(4)适合PB级以上海量数据的离线处理

可以实现上千台服务器集群并发工作,提供数据处理能力。

缺点:

(1)不擅长实时计算

MapReduce无法像MySQL一样,在毫秒或者秒级内返回结果。它的任务会跑好几个小时,好几天。

(2)不擅长流式计算

流式计算的输入数据是动态的,会一条一条的过来,是动态产生的,而MapReduce的输入数据集是静态的,不能动态变化。这是因为MapReduce自身的设计特点决定了数据源必须是静态的。

(3)不擅长DAG(有向无环图)计算

多个应用程序存在依赖关系,后一个应用程序的输入为前一个的输出。在这种情况下,MapReduce并不是不能做,而是使用后,每个MapReduce作业的输出结果都会写入到磁盘,会造成大量的磁盘IO,导致性能非常的低下。

http://www.dtcms.com/wzjs/510120.html

相关文章:

  • 网站底部友情链接怎么做的成人培训机构
  • 网站建设服务中心线上产品推广方案
  • 如何做网站家具导购青岛seo服务
  • wordpress 清空换行简述什么是seo及seo的作用
  • 自己写的网站如何添加 cnzz统计微商推广哪家好
  • 毕业论文引用网站数据怎么做脚注在百度上怎么发布信息
  • 响应式网站设计与实现论文如何建站
  • 生物技术网站开发ip域名查询
  • 乌鲁木齐官方网站营销软文网站
  • 营销型网站标准网页源码seo整站优化系统
  • 做动态网站需要什么软件超八成搜索网站存在信息泄露问题
  • m 外贸网站百度招聘电话
  • 做asp网站教程关键词seo
  • 做老电影网站侵权吗搜索引擎排名机制
  • 苹果cms网站地图怎么做天津seo排名公司
  • 怎样让网站显示网站建设中网络推广优化网站
  • 苏州做门户网站的公司大连企业黄页电话
  • 台州做网站的公司有哪些公司网络怎么推广自己的产品
  • 专业建设网站公司关于普通话的手抄报
  • 怎么做网站卖机床网站推广关键词排名优化
  • 哪里有网站培训的网站推广途径
  • 仓山区建设局招标网站百度网站入口链接
  • 英文网站如何建设网络推广的方法和技巧
  • 淘宝网站开发语言谷歌广告投放步骤
  • 湖南平台网站建设企业注册域名的步骤
  • dede织梦做的网站 栏目页有切换js 怎么循环子栏目 调子栏目国外媒体报道
  • 网站建站推广windows优化工具
  • 和优网站建设站长之家是什么网站
  • 怎么查网站的备案信息百度指数数据分析平台入口
  • 创口贴网站模板网络上哪里可以做推广