Spark

  Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算, 拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS, 因此Spark能更 好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法

0
投票
1
已解决
237
浏览
0
投票
0
回答
59
浏览
0
投票
1
已解决
66
浏览

spark如何分析hdfs 的txt文件

2016-07-01 15:23 提问
0
投票
4
已解决
159
浏览

spark部署选型问题

2016-05-20 15:33 提问
0
投票
0
回答
65
浏览

关于spark的延迟计算问题?

2016-06-22 10:31 提问
0
投票
1
已解决
152
浏览

进入pyspark报错了,求救啊?

2016-06-21 09:36 提问
0
投票
0
回答
165
浏览
0
投票
1
已解决
255
浏览

spark sql 能建索引吗?

2016-06-12 16:18 提问
0
投票
1
已解决
113
浏览

spark如何实现key value对换?

2016-06-04 10:28 提问
0
投票
1
已解决
126
浏览
0
投票
0
回答
117
浏览

50 人关注

最佳回复者

改版

反馈