Bob

同程旅游大数据+BI 架构师

始于: 2015-09-29

江苏省 苏州市

发私信

250

总声望

142

次被推荐

0

粉丝

他的回答
排序:

0
投票

有谁知道怎样在eclipse环境下,搭建spark吗

在eclipse环境下,你是想直接编译源代码,并得到其中的组件? 应该是Linux上搭建spark的

2015-10-08 18:10 回复了该问题
0
投票

在以后的生活中,统计学和大数据会成为怎样的一种相连?

大数据只是统计分析为了达到目的而引入的一个技术工具或手段。 在此之前,统计分析的基础可能都只是抽样 有了大数据,那统计分析的维度更加丰富,结论也会有更多新的发现...

2015-10-08 18:03 回复了该问题
1
投票

hive是怎么把存在MySQL下的元数据组合起来的?

hive本身是可以指定一个关系型数据库来存储hive表对象、字段信息、存储位置等基础元数据。 这个元数据库可以在hive-site.xml中指定存储的位置,例如...

2015-10-08 17:59 回复了该问题
1
投票

hbase BulkLoad 导入是不是一定要空表?如果表里有数据会被删除么??

如果原始表中有数据,则是不会被删除的。 hbase bulkload的原理是将二进制的hfile文件从底层进行装载。 在实际使用过程中,配合字典表进行名称切换,...

2015-09-29 13:34 回复了该问题
1
投票

没有JAVA功底,适合从事HADOOP哪块

hadoop相关的不一定需要很深厚的java编程功底 从自己擅长的sql方面切入进去。 1.可以使用hive 来操作hadoop文件 2.可以使用phoenix...

2015-09-29 13:32 回复了该问题
0
投票

hbase0.96.2+hive0.13.0-关联表问题

从你粘贴的log来看,项目中缺少 hbase-hadoop*-compat*.jar 这个文件。 在hbase中找到名称中包含 compat  的jar文件并放...

2015-09-29 13:29 回复了该问题
2
投票

如果只考虑开源数据库,要支持海量数据的数据仓库应用,维度建模的数据模型,MySQL和PostgreSQL该用哪个?为什么?

如果是支撑OLTP的业务,那么构建Percona-XtraDB-Cluster-server版本的MySQL集群是非常实用的,Postgresql XC集群也适...

2015-09-29 13:26 回复了该问题

改版

反馈