MarsJ

大数据玩家~DS

始于: 2015-10-13

广东省 广州市

发私信

1580

总声望

216

次被推荐

0

粉丝

他的回答
排序:

0
投票

请问在kylin中这种查询为什么不支持select sum(price) from hotprice_copy1 where price > 100.0 and price <5000.0

类似Select sum()这种查询是支持的。查询对象是一个构建好的Cube,或者说数据模型。

2016-08-29 23:50 回复了该问题
0
投票

Hive 建表报错,初步怀疑是Mysql元数据库字符集问题,但一直没解决。

MySQL字符集有很多设置的,比如Server,db。。逐一尝试

2017-11-10 11:02 回复了该问题
0
投票

在hadoop中为啥hive算中位数慢,但是rank over就很快?

你是怎么实现计算中位数的?写UDF吗?

2016-08-18 19:39 回复了该问题
0
投票

想从事分布式系统,计算,hadoop等方面,需要哪些基础,推荐哪些书籍?

要学习Hadoop,需要具备一些Linux基础,和Java基础。 推荐书籍:Hadoop权威指南,另外多关注Hadoop的官方手册。

2016-08-29 23:51 回复了该问题
0
投票

Hadoop的安装步骤是怎样的,给个完全的能安装成功的步骤

哈哈,后面出一期Hadoop搭建的视频,敬请期待大数据系列课程。

2016-08-18 19:40 回复了该问题
0
投票

请教下,hbase 里面 表结构,column Family 和 column 是什么关系啊。列都是不固定的

Column Family(CF)是列族,Column是列。Column是属于某一个指定CF的,例如有一个列族叫基本信息BaseInfo,可以将姓名、性别、年龄...

2016-08-29 23:54 回复了该问题
0
投票

这是什么问题

没有设置JAVA_HOME环境变量,就是JDK的安装目录,把它添加到/etc/profile中,然后执行source /etc/profile使其全局生效就可以...

2016-08-18 19:41 回复了该问题
0
投票

[YY直播问题] 数据量特别大怎么办?22G的R处理很难

集成大数据工具,RHadoop、Spark等。 R本质是耗内存的,数据量大了之后这种刚需,可以考虑上面说的。

2016-08-06 09:14 回复了该问题
0
投票

请教个Hadoop2.7的问题,我原来跑了个单机的,现在要扩展成分布式的,怎么把原来单机的格式化掉?

楼上说的改配置存放目录时对的,还要注意的是,在变成分布式集群格式化HDFS之前,需要删除之前单机Hadoop的namenode信息,这个信息在单机Hadoop时...

2016-08-18 19:43 回复了该问题
0
投票

谁做过spark项目,在生产上,spark作业如何配置调度作业,并提交作业到集群

提交作业到集群是spark-submit,如果是要配置Spark的作业进行调度的话,可以找一些现有的开源调度工具,但是如果场景教简单,可以直接写在Linux的c...

2016-09-14 10:37 回复了该问题
0
投票

请教下各位高人,如何获取在线旅游网站的一些数据(比如查询数据或交易数据等)?可以买得到吗?

一般交易数据肯定是获取不到的,这是关乎在线旅游网站的运营状况的。其他的信息基本靠爬虫,或者看是否有渠道购买数据。

2016-08-18 19:45 回复了该问题
0
投票

sqoop在导入数据到mysql时,如何让数据不重复导入?若存在数据问题,sqoop如何处理?

Sqoop从Hadoop或Hive或HBase将数据导出到MySQL,是导出,你可以查看一下Sqoop的增量导出。 如果Sqoop的导出你没有设置增量导出,则如...

2016-08-30 10:19 回复了该问题
0
投票

spark 读取预分region的Hbase

错误应该跟代码没关系,错误显示DNS name not found,表示域名解析错误,或者你的代码里是否写死了主机名之类的。从这方面着手解决。

2017-01-16 15:12 回复了该问题
0
投票

sqooq传输文件时报错

命令没有错,你可以先用sqoop-list-databases --connect --username --password测试一下是否能连接正常。

2016-10-11 15:08 回复了该问题
0
投票

请教个问题,ssh 免密码登录执行完了 本地ssh localhost还是需要密码是怎么回事呢?

ssh是否配置成功? 需要cat id_rsa.pub>>authorized_keys,并且将authorized_keys的权限设置为600

2016-07-14 08:28 回复了该问题

改版

反馈