MarsJ

大数据玩家~DS

始于: 2015-10-13

广东省 广州市

发私信

1580

总声望

216

次被推荐

0

粉丝

他的回答
排序:

0
投票

进程启动为什么namenode进程启动不了

在运行start-all.sh以后,使用jps命令查看是否启动正常。 另外从截图看到你使用的版本应该是hadoop1.x的,建议使用2.x的稳定版。

2016-07-27 14:24 回复了该问题
1
投票

hadoop、python、Oracle 哪个前景好?

你好,你提到的Hadoop、Python、Oracle功能和本质不一样。 Hadoop是目前比较流行的大数据平台,并且Spark是这方面的后起之秀,人气超强; ...

2016-07-27 14:22 回复了该问题
0
投票

spark 一般是和hadoop安装在相同的主机上吗,分开部署好不好?

一般是安装在相同的机器上,大多情况下Spark的存储还是用的HDFS,所以放一起会好一些。 此外Hadoop和Spark可以共用计算节点。 在者,从维护的角度讲...

2016-07-27 14:14 回复了该问题
0
投票

求教下各位:现在通过impala关联hbase,发现select 字段 from 表 是可以的,但是求sum count等操作的 时候失败。为什么?

没做过impala关联hbase的工作,只做够hive关联hbase,还挺好奇的。已关注此问题。 方便把报错信息贴出来吗?以前用过impala,速度确实比hiv...

2016-07-26 10:17 回复了该问题
0
投票

做数据处理的时候经常用到哪些程序包?

数据处理没有特定的程序包。 1、因为不同领域、不同数据规格、不同数据格式的数据处理都不一样; 2、此外即便是同一批数据,在不同的需求下(包括业务需求、应用需求)...

2016-07-26 08:52 回复了该问题
0
投票

hive表insert报错

直接插入值的语句是: insert into table xxx values (x1,x2...);

2016-07-26 08:47 回复了该问题
0
投票

sqoop支持所有关系型数据库吗?还是只支持部分,例如mysql、oracal、mssql?

应该是支持所有绝大部分关系型数据库吧。

2016-07-23 14:34 回复了该问题
0
投票

反复出现的一个问题,先前解决过,但是今天无论如何跑不过去了。 有人能解释一下,为什么物理内存的usage是怎么使用的,和哪些参数有关吗?

这情况一般都是内存配置不恰当引起的,我遇到的时候是这么解决的: yarn-site.xml添加 [code]<property> <na...

2016-07-22 09:52 回复了该问题
0
投票

一个语句中包含多个count()和collect_set() 是不是会容易导致java heap space

是否跟集群的设置有关系,例如YARN的内存大小。 这个问题很容易导致Java heap space

2016-07-22 09:47 回复了该问题
0
投票

R语言通过RODBC连接oracle

楼上正解

2016-07-21 08:27 回复了该问题
0
投票

请问:hive使用外部表形式加载数据,有什么方法可以忽略对应hdfs目录中正在写入的临时gz文件?

hdfs目录写入的路径和Hive外表的路径是一样的吗?

2016-07-21 08:25 回复了该问题
1
投票

咨询个hive的问题啊, hive jdbc 需要用户名和密码,这个用户名和密码是mysql元数据库的用户名和密码么 ‘’

是的,也就是你在hive-site.xml里面配置的这两项: [code]<name>javax.jdo.option.ConnectionUser...

2016-07-20 15:00 回复了该问题
0
投票

有没有用过sqoop2的,我想把hive中几张表导出到oracle中,不知怎么用sqoop2实现

你好,这个问题我曾经回答过。你可以参考以下的两个问题回答: [url]https://ask.hellobi.com/question/19802[/url] ...

2016-07-18 14:34 回复了该问题
0
投票

数据量达到什么级别可称为大数据?

一般来说数据量上PB级可称为大数据。 但对于这个问题是见仁见智的~在目前的环境下存储、计算无法满足需求的情况下,可以称为大数据。

2016-07-18 11:47 回复了该问题

改版

反馈