Hadoop-文章 - 天善智能-商业智能和大数据在线社区，用心创造价值

0

推荐

1994

阅读

python 实现hadoop的mapreduce

为了用python实现mapreduce，我们先引入下面两个个知识sys.stdin()itertools之groupbysys模块的简单学习sys.stdin 是一个文件描述符，代表标准输入，不需使用...

DataFrog 发布于凡人求索--李凯旋 • 2019-08-28 19:38 评论(0)

0

推荐

2874

阅读

安装Hadoop和CDH记录

一、单节点安装Hadoop1.安装java因为已经安装过了，在此不多说，之前安装记录：https://ask.hellobi.com/blog/ysfyb/12008另外有时候输入命令：jps,提示bash:...

走马兰台发布于仰视浮云白 • 2018-12-20 17:05 评论(0)

0

推荐

2669

阅读

CDH安装系统环境准备——系统版本和安装包下载地址指南

由于Hadoop深受客户欢迎，许多公司都推出了各自版本的Hadoop，也有一些公司则围绕Hadoop开发产品。在Hadoop生态系统中，规模最大、知名度最高的公司则是Cloud...

dcpeng 发布于 Python进阶者 • 2018-09-11 13:03 评论(0)

7

推荐

5392

阅读

实现Hive查询操作HBase中的数据

今天主要给大家讲解一下，如何使用Hive来查询及操作HBase里面的数据，也就是实现二者的数据互通互导，相互操作。首先不了解HBase的亲可以看一下我之前写过的...

Max_Leo 发布于 Max.L • 2018-08-27 19:54 评论(4)

7

推荐

2944

阅读

大数据环境-快速安装使用

安装大数据环境的技术博文、甚至视频课在网上有太多太多啦。还是有很多小伙伴很头疼环境安装配置，怎么安装怎么配置，总有出错的地方，都其中最头疼的莫过于L...

Max_Leo 发布于 Max.L • 2018-08-21 14:54 评论(5)

0

推荐

3634

阅读

Hadoop 50070端口无法访问

问题描述：以下情况都配置好了50070端口还是无法访问：jps后看到的信息表示Hadoop集群的组件启动正常，但是web界面打不开的原因，应该是你没有在本机的hosts...

思恩发布于天善--白鹏飞 • 2018-07-26 22:48 评论(0)

6

推荐

3570

阅读

三步构建Hive自己的dual

dual表的概念来自oracle，数据库建立时即与数据字典一起初始化，该表只有一个varchar2类型名为dummy的字段，表数据只有一行“X”，...

Max_Leo 发布于 Max.L • 2018-07-20 14:19 评论(1)

6

推荐

2756

阅读

Hive实战技能第一部

课程终于上线了，自己的第一部课，算是对自己这几年职业生涯的一次总结。接触Hive比较久，一个版本一个版本的跟到现在，从最初连NOT IN 和 NOT LIKE都不支持...

Max_Leo 发布于 Max.L • 2018-06-20 13:21 评论(2)

3

推荐

3531

阅读

HPL/SQL (Hive Hybrid Procedural SQL On Hadoop) --- 一个在Hive上执行过程SQL的工具

HPL / SQL是一种为Hive实现过程化SQL的工具。从Hive 2.0.0（HIVE-11055）开始可用。HPL/SQL对于Hive的意义，也就是PL/SQL对于Oracle的意义。对于广大的数据开...

Max_Leo 发布于 Max.L • 2018-06-08 16:49 评论(0)

0

推荐

2143

阅读

【数据蒋堂】第48期：Hadoop中理论与工程的错位

Hadoop是当前重要的大数据计算平台，它试图摒弃传统数据库的理念，重新构建一套新的大数据体系。但是，这并不是件很容易的事，在Hadoop的设计和实现中能看到...

润乾软件发布于润乾软件 • 2018-05-09 09:45 评论(0)

1

推荐

1972

阅读

【数据蒋堂】第47期：Hadoop – 一把杀鸡用的牛刀

Hadoop是个庞大的重型解决方案，它的设计目标本来就是大规模甚至超大规模的集群，面对的是上百甚至上千个节点，这样就会带来两个问题：1. 自动化管理管任务分...

润乾软件发布于润乾软件 • 2018-05-08 11:06 评论(0)

0

推荐

2207

阅读

MySQL,Hadoop闭源了咋办？

突然滴，MySQL、Hadoop等开源软件有可能被“闭源”的话题火起来了。听说，活跃在我国境内众多著名商用数据库数据仓库都是从这些开源代码改出来的，这要是被鬼子...

润乾软件发布于润乾软件 • 2018-04-21 10:19 评论(0)

3

推荐

5082

阅读

《人人都会数据分析》20万字电子版

去年的时间把之前的数据分析工作经历、大环境背景、职场选择、公司选择、岗位选择、统计学的基本常识、需要掌握的分析工具、怎么写好一个报告、互联网和金融...

面包君发布于数据分析侠 • 2018-01-03 15:15 评论(5)

3

推荐

4626

阅读

Hadoop + Hive + Spark 完整安装攻略

Prerequisites 桌面环境: Mac OSX虚拟机管理软体: Vagrant虚拟机: Virtual BoxClone repogit clone https://github.com/bryanyang0528/hellobicd h...

bryanyang 发布于 bryan的博客专栏 • 2017-11-09 11:41 评论(0)

0

推荐

2736

阅读

Sqoop增量导入

1、核心参数–check-column，用来指定一些列，这些列在导入时用来检查做决定数据是否要被作为增量数据，在一般关系型数据库中，都存在类似Last_Mod_Date的字段...

niu_poop 发布于 niupoop • 2017-08-04 22:14 评论(0)

Hadoop