天善智能-商业智能和大数据在线社区，用心创造价值

4

投票

想学习统计学，哪本书好，包含回归，聚类，神经网络，决策树

1、《统计学》第五版，William Mendenhall/Terry Sincich，统计学入门的经典教材，中文版； 2、《Introduction to S...

2016-07-11 10:22 回复了该问题

3

投票

大数据有在企业内部 bi等系统的应用场景吗？

1，用大数据做网站日志分析（主要是流量）； 2，订单分析； 3，客户分类（流失客户、潜在客户挖掘）； 4，财务方面的费用分析 ……

2016-06-02 20:02 回复了该问题

3

投票

有做医疗大数据的童鞋吗？一般这种数据都来源哪里？医疗机构，医药医疗器械公司？相关仓库？数据怎样整合？

医疗大数据所使用的数据主要来自于电子病历，因此目前很多医院的信息化也会逐步往电子病历靠拢。很多还没有采用电子病历系统的医院逐步的上这些系统。而大医院，例如包括...

2016-06-14 08:24 回复了该问题

2

投票

大数据时代的企业管理模式是怎样的？尤其是制造类企业

个人觉得像制造类偏传统行业的企业。首先需要关注大数据，而是先开始养数据，规划公司的数据中心，数据一般会来自于企业的信息中心或信息化部门；其二是可以考虑在...

2016-06-15 08:33 回复了该问题

2

投票

大家觉得目前初学者学数据做hadoop时的集群配置是不是特别麻烦?有没有一种便捷的方法？

我是在读研期间直接开始研究和学习Hadoop的，如果你只是想运行Spark，那么不用去管Hadoop的具体配置，你的重点在Spark上，此时只需要有一个配置完好...

2016-06-21 09:13 回复了该问题

2

投票

请教大神一个问题、HBase是怎样扩容的？加节点能起作用吗？

一般加Hbase节点是直接作为HRegionServer的，直接加节点，更新HRegionServer中的节点相关信息，然后启动HRegionServer。最...

2016-09-08 11:52 回复了该问题

2

投票

大数据和云计算的研究方向有哪些？大数据和云计算的基础书籍那些值得一看？

个人觉得云计算更多的是构建云环境，并且有些企业已经把云计算做到服务层面——存储、计算、服务、架构、安全等等，一应俱全。例如阿里云。而大数据更多的关注的是数据，...

2016-07-11 10:05 回复了该问题

1

投票

我想请问一下 hive on spark 和sparkSQL on hive 那个更好或者就是一回事呢

两者的共同之处在于，底层都是Spark在执行查询语句；不同之处在于，Hive on Spark是基于原有的Hive，将Hive的计算引擎从默认的MapRe...

2016-12-22 12:38 回复了该问题

1

投票

各位的集群中一般zookeeper节点一般部署几个？

集群节点由几个就部署几个，并且要是2n+1个节点。这是因为Zookeeper的选举机制，投票选举结果需要过半数才可通过，如果是2n个节点，则无法过半。

2016-06-14 19:53 回复了该问题

1

投票

请问怎么把hadoop的hdfs上的txt文件里面的数据写到我建好的一张表里面？

题主所所的表是指Hive的表吗？如果是Hive表：首先，这个txt文件必须具有与Hive表一致的格式结构，例如，字段分隔符、字段值（如果字段值与表中对应字段的...

2016-06-14 19:57 回复了该问题

1

投票

请教一个问题：hive进行查询时报这样的错，一般是什么原因呢？FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask

这里错误提示MR出问题，这只是表面错误，要Hive查询所对应的MapReduce作业的日志，才能知道真正的错误是什么。

2017-01-14 11:18 回复了该问题

1

投票

数据挖掘的工具比较多，对初学者来说，选哪个比较合适？

R语言，适合有统计学背景的小伙伴； Python，适合有计算机北京的小伙伴；此外，还有浩彬老师推荐的SPSS Modeler，还有Weka等。现在的数据...

2016-06-15 08:38 回复了该问题

1

投票

咨询大家一个问题 hdfs设置block快64M 我存储一个文件80M 那么将会分成两个块一个64M 一个16M 请问16M的存储在磁盘上所占的空间是实际大小还是是设定的块的大小

小于64M就存储文件的实际大小

2016-09-13 14:21 回复了该问题

1

投票

请教个问题，现在的大数据的一些平台像Spark/hadoop 在企业BI是怎么共存，和相互补充的？

如果企业已经有传统的BI，可以将BI前期的ETL和数据处理分析等工作挪到Spark、Hadoop上，BI只需要通过某种方式使用Hadoop、Spark的结果输出...

2016-08-29 23:45 回复了该问题

1

投票

hive查询语句中包含汉字报错

在hive-site.xml中的配置项中添加上UTF-8[code]<property> <name>javax.jdo.opt...

2016-07-13 17:46 回复了该问题

MarsJ

他关注的

他的粉丝

他的回答
排序:
时间 投票