数据仓库

  数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。 数据仓库是决策支持系统和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题。其特征在于面向主题、集成性、稳定性和时变性

0
推荐
2661
阅读

基于COOKIE的点击流数据仓库构建思路(二)

网站数据是企业数据的重要组成部分,在大型企业中,数据通常以关系型数据仓库进行存储。当然,部分企业也在向基于Hadoop等开源框架的分布式非关系型数据仓库...
0
推荐
1433
阅读

基于COOKIE的点击流数据仓库构建思路(三)

网站数据是企业数据的重要组成部分,在大型企业中,数据通常以关系型数据仓库进行存储。当然,部分企业也在向基于Hadoop等开源框架的分布式非关系型数据仓库...
0
推荐
1565
阅读

Omniture的数据输入和输出机制(上)

Adobe已经创造了多种方法来发送数据给自己的Omniture SiteCatalyst 。 这些方法包括实时跟踪在网站、电子邮件、活动、基于web、移动设备、客户端-...
0
推荐
1597
阅读

Omniture的数据输入和输出机制(下)

Adobe已经创造了多种方法来发送数据给自己的Omniture SiteCatalyst 。 这些方法包括实时跟踪在网站、电子邮件、活动、基于web、移动设备、客户端-...
0
推荐
1848
阅读

常用HiveQL总结

最近在用Hive做多维数据分析,总结一些常用HiveQL命令。1. 建表以纯文本数据建表:create table default.calendar_table ( day_cal date ,week_cal string ,...
0
推荐
1761
阅读

Hive UDF初探

1. 引言在前一篇中,解决了Hive表中复杂数据结构平铺化以导入Kylin的问题,但是平铺之后计算广告日志的曝光PV是翻倍的,因为一个用户对应于多个标签。所以,...
0
推荐
2719
阅读

轻量级OLAP(二):Hive + Elasticsearch

1. 引言在做OLAP数据分析时,常常会遇到过滤分析需求,比如:除去只有性别、常驻地标签的用户,计算广告媒体上的覆盖UV。OLAP解决方案Kylin不支持复杂数据类...
0
推荐
2054
阅读

轻量级OLAP(一):Cube计算

有一个数据多维分析的任务:日志的周UV;APP的收集量及标注量,TOP 20 APP(周UV),TOP 20 APP标注分类(周UV);手机机型的收集量及标注量,TOP 20 机型(周U...
0
推荐
2265
阅读

【Kylin实战】Hive复杂数据类型与视图

1. 引言在分析广告日志时,会有这样的多维分析需求:曝光、点击用户分别有多少?标签能覆盖多少广告用户?各个标签(标注)类别能覆盖的曝光、点击在各个DSP...
0
推荐
1740
阅读

文件水平的数据管理

结束语这不是告别文章,而是开头篇章。考虑到SPSS软件的学习是一个实操过程,用文字的方式介绍有两个问题:制文不易和学习不易,所以编者们考虑今后的软件使...
0
推荐
2713
阅读

阿里云·数加,阿里数据仓库搭建实践分享

本文来源于7月8日 【阿里云—数据化运营实践分享 7月8日 上海站】 阿里云高级技术专家 后稷 的分享,未经允许,不得转载。后稷,阿里云高级技...
0
推荐
2019
阅读

数据仓库基本概念01

文章内容来源于视频的内容,大家可以去看视频:https://edu.hellobi.com/course/9/play/lesson/116本文自己作者的笔记内容。本文大概罗列了数据仓库的一些概...
0
推荐
2913
阅读

【资料大放送】19页PPT|1小时学会建立信用评分卡(金融数据的小分析-Python)

本文是天善智能签约讲师Ben老师的课程:Hellobi Live | 4月26日 1小时学会建立信用评分卡(金融数据的小分析-Python) ,课件,未经允许,禁止转载。推...
0
推荐
2716
阅读

35岁的中年IT男之殇,如何破局走向前方?

合上笔记本,要去吃午饭了,倒杯水先,整个上午处理事情也没来得及喝水。一个上午又过去了 ,感觉也没忙多少实际的事情,是的,又是重复的一个上午。我...
0
推荐
1986
阅读

给学生朋友们一个福利——阿里校招直通通道

开门见山:一年一度的阿里校招又开始了,相信各位学生朋友们已经在各个渠道上看到校招申请入口了。而今天我要给关注我的学生朋友们带来一个福利:数据技术与...

1479 人关注

最佳回复者

改版

反馈