当前位置：首页 > wzjs >正文

百度开户做网站2400帮别人发广告赚钱平台

wzjs 2025/7/23 20:21:20

百度开户做网站2400,帮别人发广告赚钱平台,网页制作正版网站,七牛云做网站WordCount案例分析给定一个路径，统计这个路径下所有的文件中的每一个单词的出现次数。其中，需要我们去实现代码的部分是：map函数和reduce函数。它们各自的作用是： map函数的入参是kv结构，k是偏移量，v是一…

WordCount案例分析

给定一个路径，统计这个路径下所有的文件中的每一个单词的出现次数。

其中，需要我们去实现代码的部分是：map函数和reduce函数。它们各自的作用是：

map函数的入参是kv结构，k是偏移量，v是一行的具体内容。map函数的返回值格式也是kv结构，k是每个单词，v是数字1。

uce函数的入参是kv结构，k是单词，v是集合，每个元素值都是1。reduce函数的返回值格式也是kv结构，k是每个单词，v是汇总之后的数字。

WordCount案例实操-编码实现

准备maven工程，具体要求和之前的一致。具体操作如下：

1.新建一个空白项目

2.配置maven

3.创建三个类。

每个类的具体内容如下。

1.编写Mapper类

核心要点是：

继承Mapper类。约定泛型<keyIn,ValueIn,KeyOut,ValueOut>
重写map方法(keyIn, ValueIn,Content<KeyOut, Key>)

我们来看下代码。

package com.example.mapreduce;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

// 继承Mapper

public class WordCountMapper extends Mapper<LongWritable, Text, Text, LongWritable> {

@Override

protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {

// 获取一行数据，用空格拆分为一个个单词

String[] words = value.toString().split(" ");

// 遍历单词，设置键值对，值为1

for (String word : words) {

context.write(new Text(word), new LongWritable(1));

}

代码说明：

LongWritable是固定写法。它表示读取到一行的偏移量。
LongWritable, Text是hadoop的数据类型。

编写Reducer类

核心要点是：

继承Reducer类。约定泛型<keyIn,ValueIn,KeyOut,ValueOut>
重写reduce方法(keyIn, Iterable<ValueIn>,Content<KeyOut, Key>)

代码如下：

package com.example.mapreduce;

import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

import java.io.IOException;

// 继承 reducer类
public class WordCountReducer extends Reducer<Text, LongWritable, Text, LongWritable> {
    @Override
    protected void reduce(Text key, Iterable<LongWritable> values, Context context) throws IOException, InterruptedException {
        // 对 values中的值进行累加求和
        long sum = 0;
        for (LongWritable value : values) {
            sum += value.get();
        }
        // 输出结果
        context.write(key, new LongWritable(sum));
    }
}