牟瑞

大数据 Hadoop 讲师 Hadoop入门课程地址:http://www.hellobi.com/course/39 有架构师,技术总监,CTO的职位请联系我!

始于: 2013-06-09

发私信

1967

总声望

308

次被推荐

0

粉丝

他的回答
排序:

0
投票

搭建hbase的时候发现hadoop2.6.0需要重新编译本地库 想问问如何操作

是有提示的那个信息吧。如果你是构建学习环境,不用理会它,是可以正常使用的,如果你是集群环境,直接编辑就可以,附带ubuntu的编译步骤: 1、安装JDK sud...

2015-09-25 13:59 回复了该问题
2
投票

大数据与传统数据仓库项目比的优势和劣势在什么地方

优势: 1.非结构化数据:在大数据的场景下,存放大量的非结构化数据,针对不同的业务场景来做分析应用 2.处理数据量更大,在大数据的数据仓库里面采用分布式来存放数...

2015-09-25 13:54 回复了该问题
1
投票

请问 SparkContext的 textfile 如何使用正确的中文编码加载内容?好像默认没有这类参数 , 中文好像加载进来都乱码了。。。求大神支招。。

中文乱码的问题有很多种,主要是看是哪种类型的乱码,如果是字符乱码,可以采用utf8转码的方式,如果是url请求的方式乱码,可以采用urldecode的方式来解码...

2015-09-25 13:22 回复了该问题
4
投票

我想知道一下现在什么版本的Hadoop用的最多,版本如何选择

在比较大的公司,比如BAT的公司,应该是hadoop的1.x版本比较多,原因如下: 1.比较早的接触了hadoop的版本,从hadoop 0.x不断地升级演练。...

2015-09-25 13:20 回复了该问题
1
投票

各位大神!菜鸟求助应该如何学习hadoop

具体要看业务场景,其实hive的入门学习是很容易的,只要会点SQL,就可以应用Hive的简单操作。 但是如果要是深入学习的,hive的内容还是很多的 比如UDF...

2015-09-25 13:15 回复了该问题
1
投票

当了一年多Linux运维,会写shell,学过点数据库,想做数据分析方面工作,有可能吗?

给你看一张,我保存很久的图片,如果你觉得5年内,你能搞定,年薪百万不成问题 如果不能,安安静静的整点网络运维,CDN,路由器,SDN,网络部署,机房搭建等等。...

2015-09-25 11:21 回复了该问题
1
投票

我在写一个服务,前端要看一张在hdfs里的图片,我应该传什么数据给前端啊? 传图片名称+二进制数组吗?

如果是服务的话,建议你生成一个token给客户端,然后客户端采用[url]http://127.0.0.1/image?token=11111111111111...

2015-09-25 11:14 回复了该问题
1
投票

最近使用hadoop的HDFS,作为系统的文件服务器,在多个客户端上传文件,多个客户端只能下载他自己上传的文件,但是下载不了其它客户端上传的文件,请问是什么问题?

没有遇到过这种情况啊。按道理来讲,端口是开放的,每个客户端都是可以访问的。 你看一下是不是hadoop的权限问题。 在hdfs-site.xml文件里面追加 [...

2015-09-25 11:09 回复了该问题
2
投票

如何在较短时间内系统地学习大数据并从事研发工作?

不知道你所说的大数据研发是哪一类的研发,如果是hadoop的研发,可以简单的说一下观点:Hadoop开发工程师(偏向技术开发):这类工作可能要求的Java会比较...

2015-09-25 10:59 回复了该问题
0
投票

有没有知道happybase的?就是python访问hbase,我想问问能不能筛选某一列等于特定值的行并打印出来

虽然没用过happybase,但是这种方式应该可以的啊。还有问题继续留言,我给你解答[code]import happybase connection = h...

2015-09-25 10:54 回复了该问题
0
投票

请教下,大家平时做数据挖掘时,当知道一年内3-7月数据,如何根据这些月份的走势估算全年数据呢?

这个数据量有点少,只能做简单的平滑预测。用Excel就能做。 如果你有过去几年,十几年的数据,那可能考虑的东西就比较多了,比如考虑季节因素,大环境影响等等。  

2015-09-25 10:49 回复了该问题
4
投票

大数据一般都会用到哪些技术,最终成果物是什么??

现在一提大数据基本上就是hadoop,而hadoop的工作又分这么几大类 1.Hadoop运维及其相关:主要是做Hadoop的集群安装,部署与维护等等。这类工作...

2015-09-25 10:46 回复了该问题
2
投票

怎样实现数据库(MySQL、Oracle)的分布式事务操作?有什么开源项目的支持吗?

简单说下MySQL。在大数据量的情况下, 1.读写分离:数据库很大的瓶颈在于I/0,所以采用读写分离,减少I/O操作 2.分库分表:根据业务ID,比如UserI...

2015-09-25 10:39 回复了该问题
1
投票

大家好,根据业务我需要在hadoop中把ip转化成实际的地址省份,现在调用的是淘宝的接口,但发现速度实在太慢了,有没有什么好的建议。

这个说实话,我也没有什么特别好的建议,有开源的IP地址库,但是更新不及时。 另外跟蓝讯CDN等网络提供商也聊过,使用他们的IP地址库的服务,人民币30多万。 所...

2015-09-25 09:31 回复了该问题
1
投票

hadoop有没有比较好的监控工具,我想监控到某个JOB情况,比如执行时间等等

hadoop本身就自带任务监控的。http://namenode:50070

2015-09-24 08:14 回复了该问题

改版

反馈