Hive

  Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。

1
推荐
1711
阅读

Hive命令行使用方法

输入$HIVE_HOME/bin/hive –H 或者 –help可以显示帮助选项: -d,–define 定义一个变量值,这个变量可以在Hive交互Shell中引用,后面会介绍用法,比如:-d...
1
推荐
1750
阅读

hive如何分区

Hive 是用于大数据集查询的好工具 —— 特别是当数据集需要全表扫描时。但用户经常需要对某个列的值进行过滤,这时候分区就非常有效。分区是一个包含数据块的目...
1
推荐
1812
阅读

基于spark和hive的thrift server的代理中间件开发

1.hive环境0.132.实现功能通过启动代理的thrift server服务,能够分发到实际启动的spark thrift,使spark thrift 服务不会是指定用户访问,交由代理层控制。3...
1
推荐
6549
阅读

HIVE like和rlike

like与rlike的区别:like不是正则,是通配符。这个通配符可以看一下SQL的标准,例如%代表任意多个字符。rlike是正则,正则的写法与java一样。'\'需要使用'\\'...
1
推荐
1959
阅读

Hive中order by,sort by, distribute by, cluster by

面试中问到了这些问题,今天特意全方位的总结一下。另外,数据思维比技术更重要。1.Order by    Hive中的order by跟传统的sql语言中的order by作用...
1
推荐
1419
阅读

【老贝伏枥】Hive的系列化和反系列化

  对象的序列化主要有两种用途:对象的持久化,即把对象转换成字节序列后保存到文件中。  hive的序列化的作用是可以方便的将数据加载到表中而不需...
1
推荐
2165
阅读

遇到的一些hive字符串处理 汇总

持续更新。。。--取第一个顿号前面的所有字符 split(new_occupy,'、')[0] as new_occupy--替换regexp_replace(occupy,',','、')--hive不识别英文分号,...
1
推荐
12820
阅读

windows和linux连接hive问题

本文讲述下远程连接Hive遇到的一些问题一、CentOS连接Hive   尝试使用CentOS 7远程连接Hive,首先安装好需要的相关包pip install pyhive pip instal...
0
推荐
2394
阅读

《细细品味Hive》系列课程

Hi,博友:  我是解耀伟,笔名是虾皮,最近我在极客学院录制Hive系列教程,也是督促自己学习一种方式,可以把自己的学习积累有方向,星期天也能做点有意义...
0
推荐
2033
阅读

hive入门使用

1、创建表CREATE TABLE access_log (ip string, p1 string,p2 string,p3string,p4 string,p5 string,p6 string,p7 string,browser string) ROW FORMATDELIMIT...
0
推荐
1395
阅读

DataAssistant For Hadoop.Hive 最新发布

工欲善其事,必先利其器!该平台的目标是帮助使用者快速生成SQL,便捷模型管理,挖掘数据背后的秘密!节约成本提高效率提升质量欢迎试用和拍砖!For Hive下载...
0
推荐
1786
阅读

Hive UDF初探

1. 引言在前一篇中,解决了Hive表中复杂数据结构平铺化以导入Kylin的问题,但是平铺之后计算广告日志的曝光PV是翻倍的,因为一个用户对应于多个标签。所以,...
0
推荐
2292
阅读

分析函数-count() over(partition by)

在hive中验证count(*) over(partition by) 和 count(字段) over(partition by) 在字段存在空的情况下结果是没有区别的,oracle中,结果是不同的drop tab...
0
推荐
2738
阅读

轻量级OLAP(二):Hive + Elasticsearch

1. 引言在做OLAP数据分析时,常常会遇到过滤分析需求,比如:除去只有性别、常驻地标签的用户,计算广告媒体上的覆盖UV。OLAP解决方案Kylin不支持复杂数据类...
0
推荐
2278
阅读

【Kylin实战】Hive复杂数据类型与视图

1. 引言在分析广告日志时,会有这样的多维分析需求:曝光、点击用户分别有多少?标签能覆盖多少广告用户?各个标签(标注)类别能覆盖的曝光、点击在各个DSP...

相关话题

713 人关注

最佳回复者

改版

反馈