countByValue

2019-08-06  本文已影响0人  yayooo

作用:针对(K,V)类型的RDD,返回一个(K,Int)的map,表示每一个key对应的元素个数。

package com.atguigu

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

object Action {
  def main(args: Array[String]): Unit = {
    val conf: SparkConf = new SparkConf().setMaster("local[*]").setAppName("ADCount")

    val sc = new SparkContext(conf)

    val rdd: RDD[(String, Int)] = sc.makeRDD(List(("a",1),("b",2),("a",3),("b",4),("a",5)))
     val tupleToLong: collection.Map[(String, Int), Long] = rdd.countByValue()
    println(tupleToLong)

  }
}

Map((b,4) -> 1, (a,5) -> 1, (b,2) -> 1, (a,3) -> 1, (a,1) -> 1)

上一篇 下一篇

猜你喜欢

热点阅读