MarsJ

大数据玩家~DS

始于: 2015-10-13

广东省 广州市

发私信

1580

总声望

216

次被推荐

0

粉丝

他的回答
排序:

0
投票

直接hive报错,求指教,hadoop 集群中Hive挂了怎么处理,排查?

你好,错误信息可以详细一点,你的Hadoop集群是使用了StandBy模式吗?初步看不出由什么引发的错误

2016-06-23 19:38 回复了该问题
0
投票

CDH5安装后,在HUE中启动spark后,怎么运行spark shell和执行spark sql

2014年的时候用过HUE,那时候貌似还没集成Spark,如果是在Hue中启动了,那么Spark Shell和Spark SQL都应该在Hue的界面上提供了响应...

2016-06-23 08:27 回复了该问题
0
投票

单机版hadoop最多能够跑多大的数据啊

看你单机版的配置。

2016-06-22 18:51 回复了该问题
0
投票

有人会配置 sqoop2 的吗? 从mysql把数据导入到hdfs 谢谢

下面是通过Sqoop2进行导入的步骤,最近没用Sqoop2,翻了很久以前的笔记找到的,希望对你有帮助: 1,假如在MySQL中有一个这样的表T2: [att...

2016-06-21 14:33 回复了该问题
1
投票

进入pyspark报错了,求救啊?

在/etc/hosts中,127.0.0.1   localhost localhost.localdomain localhost4 localhost4.l...

2016-06-21 14:19 回复了该问题
2
投票

大家觉得目前 初学者学数据做hadoop时的集群配置是不是特别麻烦?有没有一种便捷的方法?

我是在读研期间直接开始研究和学习Hadoop的,如果你只是想运行Spark,那么不用去管Hadoop的具体配置,你的重点在Spark上,此时只需要有一个配置完好...

2016-06-21 09:13 回复了该问题
0
投票

关于Sqoop1.99.6实现从oracle到hive的数据表导入任务的问题!

你好,Sqoop 1.4.6的版本也可以在Hadoop 2.7.2上实现,并且 除了直接的sqoop import 命令外,还可以create sqoop jo...

2016-06-21 09:03 回复了该问题
0
投票

Impala和hbase集成为什么会比直接在hdfs查询要慢很多?

有比对数据吗?虽然没有实践过impala和Hbase集成,实验过Hive/Impala/Spark SQL,其中Impala的速度比Hive快很多,但是稍慢于S...

2016-06-20 20:03 回复了该问题
0
投票

ETL在数据拉取过程中卡死处理

能说一下你用做ETL的工具和方式吗?例如是否有可视化工具进行ETL调度管理和配置,用什么做的ETL?Oracle的ODI还是大数据平台可用的Sqoop?

2016-06-17 10:49 回复了该问题
0
投票

请问一下 hadoop安装后启动 总是出现 unresovled address的错误 该咋办

这种错误一般是由于主机名解析失败引起的,所以有这么几个可能: 1,每个节点的/etc/hosts中没有配好; 2,$HADOOP_HOME/etc/hadoop...

2016-06-17 09:37 回复了该问题
0
投票

各位大神,数据聚类中算法K-prototypes算法所用的包是哪一个?

是用的R里面的protoclust包

2016-06-17 08:45 回复了该问题
0
投票

使用sqoop从MySQL导表到hive中

--hive-import --hive-database DBN 这里的DBN就是你想导入的某个Hive数据库  我前几天写的一篇博客描述的就是Sqoop导入...

2016-06-15 19:46 回复了该问题
0
投票

请教大家一下,R语言的数据分析应该从哪方面入手练习啊?因为目前工作上不是用R的,看完书之后想具体去试一下。

1,如楼上所说,买本实战书籍,跟着敲,推荐《R语言实战》; 2,找一些比赛性质的课题做,例如阿里大数据竞赛、Kaggle上的课题,推荐Kaggle,Kaggle...

2016-06-15 10:37 回复了该问题
0
投票

适合hadoop进阶提高的书籍有哪些?

推荐一本《Hadoop技术内幕:深入浅出YARN架构设计与实现原理》——董西成 主要是讲Hadoop中的YARN组件的原理,带着源码一起讲的。

2016-06-15 10:34 回复了该问题

改版

反馈