TextFile分区问题怎么理解-创新互联

这篇文章主要介绍“TextFile分区问题怎么理解”，在日常操作中，相信很多人在TextFile分区问题怎么理解问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”TextFile分区问题怎么理解”的疑惑有所帮助！接下来，请跟着小编一起来学习吧！

创新互联2013年至今，是专业互联网技术服务公司，拥有项目网站制作、网站设计网站策划，项目实施与项目整合能力。我们以让每一个梦想脱颖而出为使命，1280元青龙做网站,已为上家服务,为青龙各地企业和个人服务,联系电话:18980820575

val rdd1 = sc.parallelize(List(2,3,4,1,7,5,6,9,8))
获取分区的个数:rdd1.partitions.length,在spark-shell中没有指定分区的个数获取的是默认分区数,除了这个外parallelize方法可以使用,指定几个分区就会有几个分区出现

val rdd1 = sc.textFile("hdfs://hadoop02:8020/word.txt",3).flatMap _.split('')).map((_,1)).reduceByKey(_+_)
textFile这个方法是有默认值就是2 除非改变loacl中的即默认值这个只要这个默认值小于2的话会使用小于默认的值