Flink的核心是流数据流引擎,该引擎为数据流上的分布式计算提供数据分发,通信和容错能力。Flink包括几个用于创建使用Flink引擎的应用程序的API:DataSet API,用于嵌入Java,Scala和Python的静态数据; DataStream API,用于嵌入Java和Scala的无限制流;以及Table API,其中嵌入了类似SQL的表达语言Java和Scala。Flink还捆绑了针对特定领域用例的库:机器学习库和图形处理API和库Gelly。您可以轻松地将Flink与其他知名的开源系统集成在一起,以进行数据输入,输出以及部署。(以前是平流层)
分类目录
Mac版Apache Flink的替代品
18
9
Apache Spark
Apache Spark™是用于大规模数据处理的快速通用引擎。SpeedRun程序在内存中的运行速度比Hadoop MapReduce快100倍,在磁盘上快10倍。
1