Disco MapReduce

Disco MapReduce

Disco是一个轻量级的开放源代码框架,用于基于MapReduce范例并用Python编写的分布式计算。
Disco是用于分布式计算的mapreduce的实现。Disco支持对大型数据集进行并行计算,这些数据集存储在不可靠的计算机集群中,就像Google创建的原始框架一样。这使其成为分析和处理大型数据集的理想工具,而不必担心与分发有关的困难技术,例如通信协议,负载平衡,锁定,作业调度和容错,这些由Disco处理。

特征

分类目录

Mac版Disco MapReduce的替代品

Apache Hadoop

Apache Hadoop

Apache Hadoop是一个开源软件框架,支持根据Apache v2许可获得许可的数据密集型分布式应用程序。
Apache Spark

Apache Spark

Apache Spark™是用于大规模数据处理的快速通用引擎。SpeedRun程序在内存中的运行速度比Hadoop MapReduce快100倍,在磁盘上快10倍。
dispy

dispy

dispy是一个Python框架,用于并行执行计算,方法是将计算分布在单个计算机(SMP)上的多个处理器之间,或者在群集中的许多计算机之间...