Spark

  Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算, 拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS, 因此Spark能更 好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法

0
投票
1
回答
6769
浏览
0
投票
1
已解决
3399
浏览
0
投票
0
回答
1245
浏览

如何在spark上实现非线性svm?

2015-12-24 10:42 提问
0
投票
1
已解决
910
浏览
0
投票
0
回答
1530
浏览

spark定时增量加载的问题?

2015-12-17 22:09 提问
0
投票
1
回答
1781
浏览

spark读取hdfs文件,block与executor?

2015-11-20 10:30 提问
0
投票
1
已解决
1477
浏览
0
投票
3
已解决
1819
浏览
0
投票
1
已解决
2294
浏览

谈谈你对Hive on Spark的理解?

2015-11-16 20:56 提问
0
投票
0
回答
1454
浏览
0
投票
1
回答
1073
浏览
0
投票
0
回答
1288
浏览
0
投票
1
已解决
1088
浏览

886 人关注

最佳回复者

改版

反馈