Hive

  Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。

9
推荐
5389
阅读

Hive与HBase的集成实践

注:若需转载,请注明出处!Hive与HBase集成实践大数据平台搭建 hive-2.0.0 hbase 1.1.3环境说明CentOS 6.7Hadoop 2.7.2Hive 2.0.0HBase 1.1.31. ...
7
推荐
2379
阅读

大数据环境-快速安装使用

安装大数据环境的技术博文、甚至视频课在网上有太多太多啦。还是有很多小伙伴很头疼环境安装配置,怎么安装怎么配置,总有出错的地方,都其中最头疼的莫过于L...
7
推荐
4732
阅读

实现Hive查询操作HBase中的数据

今天主要给大家讲解一下,如何使用Hive来查询及操作HBase里面的数据,也就是实现二者的数据互通互导,相互操作。首先不了解HBase的亲可以看一下我之前写过的...
6
推荐
4756
阅读

Hive复杂数据类型实战

Hive的复杂数据类型数组:ARRAY,有顺序的且每一个数组元素都必须是相同的数据类,从0开始进行索引键值对:MAP, 例,map结构体:STRUCT联合体:UNIONTYPE,由...
6
推荐
4532
阅读

Hive分区表实战

1. Hive分区表Partition和Bucket,为了提升查询效率,前者是粗粒度的划分,后者是细粒度的划分。建表语句中使用partitioned by指定分区字段分区表有静态分区...
6
推荐
2248
阅读

Hive实战技能 第一部

课程终于上线了,自己的第一部课,算是对自己这几年职业生涯的一次总结。接触Hive比较久,一个版本一个版本的跟到现在,从最初连NOT IN 和 NOT LIKE都不支持...
6
推荐
2902
阅读

三步构建Hive自己的dual

       dual表的概念来自oracle,数据库建立时即与数据字典一起初始化,该表只有一个varchar2类型名为dummy的字段,表数据只有一行“X”,...
5
推荐
1918
阅读

Hive分区技术

本周已经更新完成Hive分区的三个章节:技术详解,多重分区,动态分区在Hive Select查询中一般会扫描整个表的内容,会消耗很多时间做没必要的工作。有时候只需...
4
推荐
3731
阅读

hive和hbase整合

Hive和hbase整合依赖hive-hbase-handler.jar,存在与hive的lib下面, 应用目前只找到了两种操作:        第一种:hive创建表同时...
4
推荐
2779
阅读

Hive安装及使用攻略

让Hadoop跑在云端系列文章,介绍了如何整合虚拟化和Hadoop,让Hadoop集群跑在VPS虚拟主机上,通过云向用户提供存储和计算的服务。现在硬件越来越便宜,一台非...
3
推荐
1274
阅读

2016年1月计划

开始试着每月做计划和总结,有节奏的规划自己的时间,一月计划:1、hive那本书拖了很久了,一月一定会看完。2、因为跟着阚爷的风准备试着做一下讲师,分配给...
3
推荐
3751
阅读

Hive on Spark

注:若需转载,请注明出处!Hive on Spark大数据平台搭建 hive 2.0.0 spark 1.5.0Hive on Spark1. 修改$HIVE_HOME/conf/hive-site.xml2. 添加spark...
3
推荐
2664
阅读

Congos+Hive项目记录(一)

大数据现在已经成为企业牛逼的标配,hadoop成为了这个标配的代名词。现把日常点滴记录:一、使用jdbc方式连接cognos和hive,参考:https://ask.hellobi.com/b...
3
推荐
10829
阅读

kettle+hive使用心得之Hadoop File Output

kettle作为etl工具同步数据到hive,直接使用表输出或者插入更新组件出现速度秒级一条的尴尬,为了解决这种输出端数据同步瓶颈及缓解给领导交代的窘态,在项目...
3
推荐
3944
阅读

Hadoop + Hive + Spark 完整安装攻略

Prerequisites 桌面环境: Mac OSX虚拟机管理软体: Vagrant虚拟机: Virtual BoxClone repogit clone https://github.com/bryanyang0528/hellobicd h...

相关话题

713 人关注

最佳回复者

改版

反馈