Spark

  Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算, 拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS, 因此Spark能更 好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法

0
投票
1
回答
19
浏览

Spark 动态UDF

2017-04-20 09:03 提问
0
投票
1
回答
28
浏览
0
投票
1
回答
20
浏览

spark mongodb 集群部署

2017-04-18 09:15 提问
0
投票
2
已解决
30
浏览
0
投票
1
已解决
34
浏览
0
投票
1
已解决
28
浏览
0
投票
2
回答
72
浏览
0
投票
1
回答
60
浏览

IntelliJ IDEA安装scala插件问题

2017-03-28 14:17 提问
0
投票
1
已解决
45
浏览

61 人关注

最佳回复者

改版

反馈