类似Select sum()这种查询是支持的。查询对象是一个构建好的Cube,或者说数据模型。
2016-08-29 23:50 回复了该问题要学习Hadoop,需要具备一些Linux基础,和Java基础。 推荐书籍:Hadoop权威指南,另外多关注Hadoop的官方手册。
2016-08-29 23:51 回复了该问题Column Family(CF)是列族,Column是列。Column是属于某一个指定CF的,例如有一个列族叫基本信息BaseInfo,可以将姓名、性别、年龄...
2016-08-29 23:54 回复了该问题没有设置JAVA_HOME环境变量,就是JDK的安装目录,把它添加到/etc/profile中,然后执行source /etc/profile使其全局生效就可以...
2016-08-18 19:41 回复了该问题集成大数据工具,RHadoop、Spark等。 R本质是耗内存的,数据量大了之后这种刚需,可以考虑上面说的。
2016-08-06 09:14 回复了该问题楼上说的改配置存放目录时对的,还要注意的是,在变成分布式集群格式化HDFS之前,需要删除之前单机Hadoop的namenode信息,这个信息在单机Hadoop时...
2016-08-18 19:43 回复了该问题提交作业到集群是spark-submit,如果是要配置Spark的作业进行调度的话,可以找一些现有的开源调度工具,但是如果场景教简单,可以直接写在Linux的c...
2016-09-14 10:37 回复了该问题一般交易数据肯定是获取不到的,这是关乎在线旅游网站的运营状况的。其他的信息基本靠爬虫,或者看是否有渠道购买数据。
2016-08-18 19:45 回复了该问题Sqoop从Hadoop或Hive或HBase将数据导出到MySQL,是导出,你可以查看一下Sqoop的增量导出。 如果Sqoop的导出你没有设置增量导出,则如...
2016-08-30 10:19 回复了该问题错误应该跟代码没关系,错误显示DNS name not found,表示域名解析错误,或者你的代码里是否写死了主机名之类的。从这方面着手解决。
2017-01-16 15:12 回复了该问题命令没有错,你可以先用sqoop-list-databases --connect --username --password测试一下是否能连接正常。
2016-10-11 15:08 回复了该问题ssh是否配置成功? 需要cat id_rsa.pub>>authorized_keys,并且将authorized_keys的权限设置为600
2016-07-14 08:28 回复了该问题