Bob

同程旅游大数据+BI 架构师

始于: 2015-09-29

江苏省 苏州市

发私信

250

总声望

142

次被推荐

0

粉丝

他的回答
排序:

0
投票

请问,hive上给用户授权创建数据库的命令是什么呢?

设置集群的参数: hive.security.authorization.enabled=true hive.security.authorization.cr...

2016-07-07 17:15 回复了该问题
0
投票

hbase数据库每天都会录入很多数据,我现在停止录入数据了,怎么查看我最后录入的一条数据,有知道的大神指导一下,我的Hbase 版本是0.94.14

在0.94/0.96等版本中这个确实不是很好处理,你根据rowkey扫描来做吧。设置Startkey,endkey()来达到获取最后一条的效果。   如果是在0...

2016-07-06 19:20 回复了该问题
0
投票

问下hdfs用户的默认密码是多少?我装cdh的时候没设置密码啊

试试你安装时登录Linux的用户和密码

2016-07-06 19:04 回复了该问题
0
投票

SSIS外部源首行记录为空导入到数据库表中失败

SSIS在读取excel文件时会根据首行来判断数据类型及长度。   尝试进行如下做法:在excel源上右键—属性,编辑excel的链接字符串: 在原有的链接字符...

2016-07-06 19:03 回复了该问题
0
投票

怎么可以把map的键值对当中的字符串转换为整数类型{"15001764382":"2","15317001287":"3"}?????

改下map端输出的值类型,例如改为IntWritable 然后在map函数中对value值进行转换,然后context.writer()输出

2016-07-06 08:40 回复了该问题
1
投票
0
投票

运行greenplum 的 gpcheckos时报错 platform.memory mistach (value 8167837696 should == 8134156288)。该怎么修改呀?

可能是你的shared_buffers 设置过大造成的。

2016-07-05 12:56 回复了该问题
0
投票

pg_xlog 目录里保存的二进制log文件数数量是wal_keep_segments参数决定的么?我设置 wal_keep_segments = 256,但是实际却有322个,求解

wal_keep_segments是只日志文件的最小量。 此配置的详细说明可参看: [url]http://www.runoob.com/manual/Post...

2016-07-05 12:54 回复了该问题
1
投票

请教个问题,大数据分析是怎么把传统RDBMS中的数据导到hadoop的,写代码实时获取数据?还是直接导库?

使用sqoop直接导库的数据到hadoop吧 然后可以使用hive写sql进行查询

2016-07-05 12:38 回复了该问题
1
投票

大数据商业化是否分历程,国内市场大数据商业化目前在什么阶段,其应用场景集中在什么地方。大数据未来发展趋势,商业成熟会在什么时间发生,以及到时的市场规模?

个人观点: 国内大数据商业起步在2014年就开始了,2015年是很多大数据公司获得融资的时间窗口 目前的应用场景主要是:帮助企业构建一体化的大数据平台,包含分析...

2016-07-01 08:43 回复了该问题
0
投票

请教~mongo能直接读取hive的数据吗?

能的。 给你一个官网的示例: https://www.mongodb.com/blog/post/using-mongodb-hadoop-spark-part...

2016-07-01 08:38 回复了该问题
0
投票

请教个问题,比如我在本机WINDOWS下安装ECLIPSE ,而NN和DN在另外2台LINUX服务器上面,我能在本机的ECLIPSE上直接运行WORDCOUNT程序么? 不打包,还是说eclipse必须安在linux上面才能直接运行?

如果想不打包就运行java程序,则需要在eclipse中配置hadoop的插件。 建议你在Linux环境中开发hadoop的MR程序

2016-07-01 08:36 回复了该问题
0
投票

spark部署选型问题

我们在实际使用过程中使用yarn来进行spark的任务调度。   参考:https://spark.apache.org/docs/1.6.0/running-...

2016-06-28 13:41 回复了该问题
1
投票

如果以后从事的方向是ETL,那么需要我应着重从哪个方面开始学习,希望大神能指点一个大致学习方向,谢谢。ps:我现在所从事的工作是系统运维,日常工作用得的有linux基础,shell脚本编写,mysql基本语句命令

从你最擅长的方式入手: 努力学习sql编程,包括调优、各种函数使用等,这会极大地提升你做数据处理时的效率 其次了解下数据处理的工具,例如kettle,datas...

2016-06-28 13:19 回复了该问题
0
投票

问下有人做过网站或者app或者游戏的用户分析吗?比如拉新数量,留存数量这类的

从你这个问题上,没看出是想问什么?是想学点这个方面经验,还是想认识些人呢? 做移动互联网都会关注这几个指标:UV、拉新、注册转化率、留存等 这些数据指标都是运营...

2016-06-28 13:14 回复了该问题

改版

反馈