Disco MapReduce

Disco MapReduce

Disco是一个轻量级的开放源代码框架,用于基于MapReduce范例并用Python编写的分布式计算。
Disco是用于分布式计算的mapreduce的实现。Disco支持对大型数据集进行并行计算,这些数据集存储在不可靠的计算机集群中,就像Google创建的原始框架一样。这使其成为分析和处理大型数据集的理想工具,而不必担心与分发有关的困难技术,例如通信协议,负载平衡,锁定,作业调度和容错,这些由Disco处理。

特征

分类目录

具有开源许可证的Linux版Disco MapReduce的替代方案