300字范文,内容丰富有趣,生活中的好帮手!
300字范文 > 大数据之-Hadoop3.x_MapReduce_排序概述---大数据之hadoop3.x工作笔记0114

大数据之-Hadoop3.x_MapReduce_排序概述---大数据之hadoop3.x工作笔记0114

时间:2020-08-14 20:28:20

相关推荐

大数据之-Hadoop3.x_MapReduce_排序概述---大数据之hadoop3.x工作笔记0114

1.看MapReduce的排序,我们先看一下,map方法之后 ,数据整理以后会,进入环形缓冲区,然后

环形缓冲区中的数据满了以后,多于百分之80的时候,会进行数据溢写,数据溢写之前会进行排序对吧,可以看到分区内的数据会进行分区快排,快排以后,然后会一些到文件,然后会再对这个区内有序的文件会再进行归并排序.上面的map阶段的排序.

2.然后我们再看在reduce阶段,会先把map阶段整理好的数据,拉取过来,然后,拉取的动作是reduceTask完成的,然后拉取以后,因为有可能是从不同的分区,也就是不同的mapTask中拉取

过来的,所以,reduceTask又对拉取过来的数据进行了一次归并排序,当然归并排序以后,还可以对数据进行一次分组排序,也可以我们自定义分组排序,这个后面再说吧.经过这些排序就可以交给reducer进行数据处理了.

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。