Disco是用于分布式计算的mapreduce的实现。Disco支持对大型数据集进行并行计算,这些数据集存储在不可靠的计算机集群中,就像Google创建的原始框架一样。这使其成为分析和处理大型数据集的理想工具,而不必担心与分发有关的困难技术,例如通信协议,负载平衡,锁定,作业调度和容错,这些由Disco处理。
特征
分类目录
Mac版Disco MapReduce的替代品
18
9
Apache Spark
Apache Spark™是用于大规模数据处理的快速通用引擎。SpeedRun程序在内存中的运行速度比Hadoop MapReduce快100倍,在磁盘上快10倍。