MapReduce - 就爱阅读网 - 养生与程序人生
语言程序

Google 怎么样做 50 PB 数据排序的?

阅读(382)评论(0)

        自从创造 MapReduce 以来,我们就通过对海量随机数据进行排序来测试它。我们喜欢排序,因为很容易生成任意数量的数据,检查输出是否正确同样简单。尽管最初的 MapReduce 论文提交了一个 TeraSort 结果。工程师定期通过对 1TB 或者 10TB 的数据排序来做回归测试...