Hadoop

  Hadoop 是 Apache 软件基金会所研发的开放源码并行运算编程工具和分布式档案系统,与 MapReduce 和 Google 档案系统的概念类似

1
推荐
1774
阅读

Mahout分步式程序开发 基于物品的协同过滤ItemCF

前言Mahout是Hadoop家族一员,从血缘就继承了Hadoop程序的特点,支持HDFS访问和MapReduce分步式算法。随着Mahout的发展,从0.7版本开始,Mahout做了重大的升...
0
推荐
1907
阅读

大数据的泰坦尼克号,Hadoop 即将沉没了吗?

最糟糕的消息并非 Hadoop 这艘泰坦尼克号注定要沉没,而是海面上压根没有其它泰坦尼克级别的船只可以用来救援。对很多大数据领域的投资者和用户,尤其是在 Ha...
5
推荐
1714
阅读

从源代码剖析Mahout推荐引擎

前言Mahout框架中cf.taste包实现了推荐算法引擎,它提供了一套完整的推荐算法工具集,同时规范了数据结构,并标准化了程序开发过程。应用推荐算法时,代码也...
5
推荐
2016
阅读

用MapReduce实现矩阵乘法

前言MapReduce打开了并行计算的大门,让我们个人开发者有了处理大数据的能力。但想用好MapReduce,把原来单机算法并行化,也不是一件容易事情。很多的时候,...
3
推荐
2283
阅读

Mahout推荐算法API详解

前言用Mahout来构建推荐系统,是一件既简单又困难的事情。简单是因为Mahout完整地封装了“协同过滤”算法,并实现了并行化,提供非常简单的API接口;困难是因为...
1
推荐
1959
阅读

用Maven构建Mahout项目

前言基于Hadoop的项目,不管是MapReduce开发,还是Mahout的开发都是在一个复杂的编程环境中开发。Java的环境问题,是困扰着每个程序员的噩梦。Java程序员,不...
1
推荐
1944
阅读

在Ubuntu中安装HBase

前言HBase是Hadoop家族中的一个分布式数据库产品,HBase支持高并发读写,列式数据存储,高效的索引,自动分片,自动Region迁移等许多优点,已经越来越多的被...
2
推荐
2090
阅读

Hadoop编程调用HDFS

前言HDFS 全称Hadoop分步文件系统(Hadoop Distributed File System),是Hadoop的核心部分之一。要实现MapReduce的分步式算法时,数据必需提前放在HDFS上。因...
1
推荐
2107
阅读

用Maven构建Hadoop项目

前言Hadoop的MapReduce环境是一个复杂的编程环境,所以我们要尽可能地简化构建MapReduce项目的过程。Maven是一个很不错的自动化项目构建工具,通过Maven来帮...
1
推荐
2129
阅读

Hadoop历史版本安装

前言介绍Hadoop安装的文章,已经写过2篇了,老生常谈的话题又被拿出来了。这次要重新安装Hadoop-1.1.2的历史版本,来满足Mahout-0.8版本的依赖要求。本来只想...
1
推荐
1775
阅读

Hive学习路线图

前言Hive是Hadoop家族中一款数据仓库产品,Hive最大的特点就是提供了类SQL的语法,封装了底层的MapReduce过程,让有SQL基础的业务人员,也可以直接利用Hadoop...
2
推荐
2009
阅读

Hadoop家族学习路线图 开篇必读

前言使用Hadoop已经有一段时间了,从开始的迷茫,到各种的尝试,到现在组合应用….慢慢地涉及到数据处理的事情,已经离不开hadoop了。Hadoop在大数据领域的成...
1
推荐
1536
阅读
0
推荐
1615
阅读

Hadoop技术在商业智能BI中的应用

Hadoop是个很流行的分布式计算解决方案,是Apache的一个开源项目名称,核心部分包括HDFS及MapReduce。其中,HDFS是分布式文件系统,MapReduce是分布式计算引...
3
推荐
1723
阅读

搭建hadoop环境遇到的问题

不断扩充中  嗯 ing~目录1、50070端口访问失败 ,已关闭防火墙。18088端口可以访问2、datanode没有启动3、jdk安装报错:Error occurred during initaliz...

1102 人关注

最佳回复者

改版

反馈