MarsJ

大数据玩家~DS

始于: 2015-10-13

广东省 广州市

发私信

1580

总声望

216

次被推荐

0

粉丝

他的回答
排序:

0
投票

sqoop job -create报错ERROR hsqldb.HsqldbJobStorage: Can not interpret metadata schema

检查metadata有什么问题,包括那个文件的权限。有可能你多次初始化之后产生了前后不一致的metadata version

2017-01-14 11:23 回复了该问题
0
投票

我有个问题。 就是向hdfs里-put文件的时候 报异常 但是namenode 和datanode都正常启动了怎么回事呢

需要给出报异常的错误信息哦,否则不知道错在哪里

2016-08-05 15:12 回复了该问题
0
投票

求教一个问题。集群之间的数据拷贝。是不是只支持文件拷贝。有没有哪位大虾研究过? 是否支持PQRQUET压缩表拷贝??

cluster1和cluster2之间吗?貌似是的,hadoop distcp -f参数只能列出文件列表。

2017-01-14 11:27 回复了该问题
0
投票

kettle抽取oracle数据到hbase遇到问题

错误显示,无法连接HBase。可能的原因: 1,HBase是否正常运行,端口是否开放; 2,Kettle是否配置正确HBase连接字符串

2017-01-14 11:29 回复了该问题
0
投票

天善的大神们,请问一下,我现在HADOOP的环境是2.7.1,是apache 的,我现在要下载sqoop,哪个版本较好一些呀,有没有版本限制呀。

1.4.6 OK的 我的Hadoop环境是Apache Hadoop2.7.2,推荐一下我的一篇关于Sqoop导入的博文: https://ask.hellob...

2016-06-29 08:22 回复了该问题
0
投票

格式化hadoop集群时的问题,请高手帮忙看看啥问题?怎么解决?

连不上机器,检查: 1、/etc/hosts有没有配好IP和主机名的解析? 2、防火墙是否关闭 3、SSH是否做好

2016-08-05 15:16 回复了该问题
0
投票

请教下,提取文本标签,主题,情感分析都用些什么算法?

首先要分词,主要是命名实体识别。 可以用TFI-DF、LSA等算法

2016-06-29 08:26 回复了该问题
0
投票

刚才配置了一下hive但是启动显示权限不够是怎么回事?

看一下bin下面的hive脚本文件有没有可执行权限,就是rwx中的x

2016-09-13 14:18 回复了该问题
0
投票

适合hadoop进阶提高的书籍有哪些?

推荐一本《Hadoop技术内幕:深入浅出YARN架构设计与实现原理》——董西成 主要是讲Hadoop中的YARN组件的原理,带着源码一起讲的。

2016-06-15 10:34 回复了该问题
0
投票

请教大家一下,R语言的数据分析应该从哪方面入手练习啊?因为目前工作上不是用R的,看完书之后想具体去试一下。

1,如楼上所说,买本实战书籍,跟着敲,推荐《R语言实战》; 2,找一些比赛性质的课题做,例如阿里大数据竞赛、Kaggle上的课题,推荐Kaggle,Kaggle...

2016-06-15 10:37 回复了该问题
0
投票

请问下,hive限制用户写入hdfs数据量大小在哪儿配置?

你指的是HDFS块的大小还是整体文件的大小?

2017-08-18 10:38 回复了该问题
0
投票

请问一下 hadoop实时查询用什么组件?还是导入到mysql中查询~

近实时的可以用HBase,查询性能还是可以的,只是你得学习HBase查询的接口, 导出到MySQL这种方式也可行。

2016-08-18 19:38 回复了该问题

改版

反馈