Bob

同程旅游大数据+BI 架构师

始于: 2015-09-29

江苏省 苏州市

发私信

250

总声望

142

次被推荐

105

粉丝

他的回答
排序:

0
投票

java.lang.ClassNotFoundException: kafka.serializer.StringDecoder对应的jar包是存在类的,但是找不到类,这是为什么?

NoClassDefFoundError: kafka/serializer/StringDecoder的原因是缺少以下jar包: spark-streamin...

2017-04-26 13:34 回复了该问题
0
投票

hadoop启动jar 报地址错误怎么解决?

设置下这个linux机器的hostname=hadoop

2017-04-19 13:35 回复了该问题
0
投票

大数据Hadoop开发需要哪些数学基础知识?

你是做程序开发,还是想做算法模型? hadoop本身是可以用各种语言编写程序进行批处理运行,所以只需要编程基础,例如python java   如果是想用rha...

2017-04-07 15:40 回复了该问题
0
投票

现阶段,请问一下 hadoop和spark分别用什么版本合适呢?

一般建议使用cloudera公司的产品,目前是5.* 这些是企业版本,修复了很多bug,所以使用起来更加方便   下载地址:[url]http://archiv...

2017-03-30 14:00 回复了该问题
0
投票

做大数据大家比较关心哪个方面?优先保证hadoop整个集群的正常运转?快速开发map/reduce?保证数据分析的速度?保证数据分析的准确性?

1.能不能达到领导的目标和期望 2.从技术、人力等方面的投入产出是否符合现状 3.整套体系运行起来后的维护人力、时间方面是否是可承受范围 4.对现有的运营效率是...

2017-03-30 13:55 回复了该问题
0
投票

大数据实时解决方案

1.在数据源方面则尽量去实时收集。可以让他们主动向你的消息队列中写入数据,也可以部署flume去主动收集他们的日志数据。 2.数据进入到消息队列以后,用flum...

2017-03-28 15:53 回复了该问题
0
投票

主流的数据分析语言

常用的算法包都是齐全的 现有的大数据技术都具有python的运行环境,例如hadoop,spark等

2017-03-28 14:18 回复了该问题
0
投票

请教下SSRS能否实现车企中比较简单的BI

做好SSAS,多维数据模型中的维度和度量值组   SSRS也是可以做到类似的呈现效果

2017-03-28 14:17 回复了该问题
0
投票

各位大神,麻烦问下,用shell调hive脚本的时候,select * from test中的* 怎么处理的

hive -e 'SELECT * from test_table'

2017-03-14 13:32 回复了该问题
0
投票

大批量往hbase写数据会导致RegionServer 挂掉。 请问怎么优化? 求帮助。

增加wal的缓存大小 增大hbase-site.xml中写入的内存占比

2017-03-14 13:31 回复了该问题
1
投票

hive的启动问题。

检查${HIVE_HOME}/conf/hive-site.xml中的以下四个属性对应的值: <name>javax.jdo.option.Conn...

2017-03-14 13:29 回复了该问题
0
投票

国内大多互联网公司的大数据工程师实习都是需要大数据项目经验,怎么样在自己研究方向不是数据科学和ml相关的情况下接触到hadoop,spark相关项目呢?

多学习,cloudera公司的官网上就有包含所有大数据技术的虚拟机,供学习使用。 多逛大数据的问答社区 主动参与到其他的项目,哪怕是打杂都是可以的。学习这些项目...

2017-03-14 13:24 回复了该问题
0
投票

数据仓库从MySQL向大数据平台迁移的方案

数据仓库建议选择使用hive,用hql语句也能完成update delete的操作。 如果仓库是在hive上,那原来的ETL操作 都改为使用hql脚本吧。这个查...

2017-03-14 13:22 回复了该问题
0
投票

有人能大概的解释下类似于hadoop spark这些东西 预编译和源码安装的区别主要是在哪

源代码安装方式是需要你主动编译项目,大部分都是maven 进行编译,在这个过程中需要下载很多相关的jar包,很耗费时间。而且在编译过程中还需要check本机的系...

2017-03-14 13:20 回复了该问题
0
投票

请问下,在SSIS中的数据流任务中的数据源用存储过程返回一个select结果集和用视图返回一个select结果集有区别吗?

只是不是特别复杂的逻辑,那用视图和存储过程是基本一致的。如果复杂度高,那么用视图进行查询会稍微慢些 在你的这个场景中,建议你用视图来处理吧。

2017-03-14 13:15 回复了该问题

改版

反馈