Spark

  Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算, 拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS, 因此Spark能更 好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法

0
投票
1
回答
76
浏览

Spark job server context 管理问题

2017-01-19 09:27 提问
0
投票
1
回答
46
浏览
0
投票
1
回答
55
浏览

scala API说明

2017-02-08 10:35 提问
0
投票
1
回答
67
浏览

spark读取hive udf问题

2017-02-13 09:17 提问
0
投票
2
已解决
106
浏览

spark 读取预分region的Hbase

2017-01-16 09:54 提问
0
投票
1
回答
76
浏览
0
投票
0
回答
67
浏览
0
投票
1
回答
63
浏览
0
投票
0
回答
49
浏览

61 人关注

最佳回复者

改版

反馈

======= >>>>>>> b75eec8b3e680c1b60a08a6bb3f9cd752a33281c