Disco MapReduce

1

Disco MapReduce

Disco是一个轻量级的开放源代码框架，用于基于MapReduce范例并用Python编写的分布式计算。

免费应用
Windows
Mac
Linux

Disco是用于分布式计算的mapreduce的实现。Disco支持对大型数据集进行并行计算，这些数据集存储在不可靠的计算机集群中，就像Google创建的原始框架一样。这使其成为分析和处理大型数据集的理想工具，而不必担心与分发有关的困难技术，例如通信协议，负载平衡，锁定，作业调度和容错，这些由Disco处理。

网站:

http://discoproject.org/

特征

分散式

分类目录

发展历程

具有任何许可的所有平台的Disco MapReduce替代品

Apache Hadoop

18

Apache Hadoop

Apache Hadoop是一个开源软件框架，支持根据Apache v2许可获得许可的数据密集型分布式应用程序。

免费应用
Windows
Mac
Linux

Apache Spark

9

Apache Spark

Apache Spark™是用于大规模数据处理的快速通用引擎。SpeedRun程序在内存中的运行速度比Hadoop MapReduce快100倍，在磁盘上快10倍。

免费应用
Windows
Mac
Linux

Amazon Kinesis

1

Amazon Kinesis

Amazon Kinesis服务使在AWS云中轻松处理实时流数据成为可能。

付费应用
Web

Apache Flink

0

Apache Flink

HPCC Systems

0

HPCC Systems

Linux

dispy

0

dispy

dispy是一个Python框架，用于并行执行计算，方法是将计算分布在单个计算机（SMP）上的多个处理器之间，或者在群集中的许多计算机之间...

免费应用
Windows
Mac
Linux