Bob

同程旅游大数据+BI 架构师

始于: 2015-09-29

江苏省 苏州市

发私信

250

总声望

142

次被推荐

0

粉丝

他的回答
排序:

0
投票

hive 创建表的时候报错

这个问题反应了hive元数据所在数据库的字符集和集群不一致,你需要修改下。

2017-02-07 19:34 回复了该问题
0
投票

hadoop的那个textInputformat自定义分隔符怎么弄??

自己写一个类去继承 TextInputFormat,在 public RecordReader < LongWritable , Text > cr...

2017-02-07 19:32 回复了该问题
0
投票

请问spark sql 是否支持对hive 外表的插入操作

可以操作

2016-12-29 16:53 回复了该问题
0
投票

hive建表的时候插入数据到元数据库mysql里,这部分代码在hive代码里面是在什么位置?

hive的元数据配置在hive-site.xml中。  

2016-12-29 16:48 回复了该问题
1
投票

如何利用spark、hadoop等技术实现关系型数据库的数据快速汇总?

1.使用sqoop进行定时的数据抽取工作,并存放到hive数据仓库中,使用hive的hql进行数据汇总。这个方案中可以使用hive on tez 或者hive ...

2016-12-29 16:47 回复了该问题
0
投票

我想请问一下 hive on spark 和sparkSQL on hive 那个更好 或者就是一回事呢

本质上就一回事情。都是使用spark sql来访问hive的表和数据。 在访问过程中有两种形式: 1.你需要进行spark代码编程,来实现对hive的访问。 编...

2016-12-22 11:33 回复了该问题
0
投票

请问有人知道这个是什么意思吗?

这个是你的namenode节点异常了

2016-12-21 12:56 回复了该问题
0
投票

hive问题请教,求帮助,谢谢

nohup hive -f a.sql & nohup hive -f b.sql & nohup hive -f c.sql

2016-12-21 12:53 回复了该问题
1
投票

hbase中有海量网页源代码,需要从海量源代码中精确抽取出【作者,时间,评论内容,点击数】等信息,请问,我该按照什么步骤,思路操作?

1.对网页源代码进行抽样查看,确认作者,时间,评论内容,点击数对应的位置,并编写好对应的正则表达式 2.编写程序对hbase的数据进行遍历 这个过程可以使用sc...

2016-12-16 13:30 回复了该问题
0
投票

各位大神,请问hive有没有什么工具跟oracle的plsql差不多的功能?

presto是可以行的一个工具 hive是可以提供jdbc的访问方式,目前的hue、impala都是支持面向hive写HQL的

2016-12-12 13:04 回复了该问题
0
投票

请问logstash和flume收集日志,哪个用的群体多些

logstash更多地是面向运维日志方面的分析和查看。自身提高了收集和查询等功能   flume是面向日志分析方面的ETL工具,与kafka、storm结合可以...

2016-12-12 13:01 回复了该问题
0
投票

hive导入hbase有什么好的方法或工具吗

hive可以直接映射到hbase的一个表。 然后你可以使用HQL对这个表进行修改等操作

2016-11-17 13:31 回复了该问题
2
投票

hive是不是不太支持生产环境上进行delete update操作

hive的数据本质上还是存储在HDFS中,HDFS的原则是一次写入,多次读取。 你想在生产环境中进行更新和删除操作,那相当于把hive当做数据库来中,一个场景非...

2016-11-17 13:30 回复了该问题
1
投票

你们好,问一下从mssql数据库抽取数据到hadoop中用什么工具啊

1.sqoop --使用简单,推荐你用 2.阿里的DataX 3.kettle

2016-11-17 13:28 回复了该问题

改版

反馈