Spark

Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架，Spark基于map reduce算法实现的分布式计算，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是Job中间输出和结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法

排序：

时间未回答

4

投票

13

已解决

22434

浏览

超级菜鸟怎么学习数据分析？数据挖掘、工具、技术、所需知识点等？

2018-01-08 14:44 提问

0

投票

1

回答

7245

浏览

调用spark1.3.0的word2vec算法，一直报错

2016-02-01 21:43 提问

0

投票

1

已解决

3790

浏览

为什么spark支持多种语言编程，而mapreduce只支持java

2016-01-04 21:03 提问

0

投票

0

回答

1812

浏览

如何在spark上实现非线性svm？

2015-12-24 10:42 提问

0

投票

1

已解决

1271

浏览

Spark是不是能把所有传入作为参数的函数都分布式进行计算？

2015-12-21 20:52 提问

0

投票

0

回答

2188

浏览

spark定时增量加载的问题?

2015-12-17 22:09 提问

0

投票

0

回答

2657

浏览

网络流量实时分析（流式数据挖掘）用什么算法比较合适，有监督、无监督、半监督？计划在spark平台上研究

2015-12-14 12:37 提问

0

投票

0

回答

1483

浏览

storm有个问题,求指导：保证相同的field会在同一个task去处理？这种情况下，应该怎么搞？

2015-12-07 14:51 提问

0

投票

1

回答

2264

浏览

spark读取hdfs文件,block与executor?

2015-11-20 10:30 提问

0

投票

1

已解决

1845

浏览

spark是否可以像处理txt文件一样处理xml文件？

2015-11-19 20:46 提问

0

投票

3

已解决

2514

浏览

Spark目前的瓶颈在哪里，还有希望解决么？

2015-10-28 22:24 提问

0

投票

1

已解决

2979

浏览

谈谈你对Hive on Spark的理解？

2015-11-16 20:56 提问

0

投票

0

回答

1806

浏览

为什么Spark的taskSet.resourceOffer每次只返回一个task？

2015-11-15 22:11 提问

0

投票

1

回答

1485

浏览

有Java基础的人，想学习大数据，该如何着手呢？

2015-11-11 22:10 提问

0

投票

0

回答

1641

浏览

spark kmeans 如何保证centers一致性，centers如何存放？

2015-11-10 11:23 提问

0

投票

1

已解决

1451

浏览

学习Hadoop scala spark等对从事安全工作用处大么？

2015-11-08 22:20 提问

«
1
2
3
4
5
6
7
8
9
10
11
»

887 人关注

最佳回复者

Bob
获得12次推荐
MarsJ
获得8次推荐
牟瑞
获得5次推荐
万里88
获得4次推荐
在学古筝的程序员
获得3次推荐

改版

反馈