作者:凌岸 终身学习者@数据分析&数据挖掘^Python爱好者社区专栏作者知乎专栏:https://www.zhihu.com/people/yuan-fang-20-16建模不...
作者:接地气的陈老师链接:https://www.zhihu.com/question/26695520/answer/294244813来源:知乎作为一个经常整出来漂亮的活动ROI报告的老兵,分享一些精准...
Ben,多本数据科学畅销书作家,先后在亚信、德勤、百度等企业从事电信、金融行业数据挖掘工作。配套学习教程:数据科学实战:Python篇 https://edu.hell...
前言先来简短的回顾一下决策树原理:决策树学习的算法通常是一个递归地(根据某一准则,信息增益或基尼系数)选择最优切分点/特征,并根据该特征对训练数据集...
一些初学者会犹豫要不要参加 Kaggle 竞赛,这并不让人奇怪,他们通常有以下顾虑:我该如何开始?我要和经验丰富的博士研究者比赛吗?如果没有获胜的机会,还...
又到年底,汇报成堆。这时候同学们开始抓耳挠腮,感觉写汉字比写代码难多了,半天憋不出来个屁。为了减轻大家汇报负担,陈老师总结了常用汇报模板,大家自行...
HPL / SQL是一种为Hive实现过程化SQL的工具。从Hive 2.0.0(HIVE-11055)开始可用。HPL/SQL对于Hive的意义,也就是PL/SQL对于Oracle的意义。对于广大的数据开...
Apache Kylin社区于日前宣布:Apache Kylin v2.4.1 正式发布!欢迎大家下载使用。Apache Kylin 是一个开源的分布式分析引擎,提供 Hadoop 之上的 SQL 查...
一、 大数据基本概念
大数据Big Data是指大小超出了常用的软件工具在运行时间内可以承受的收集,管理和处理数据能力的数据集;大数据是目前存储模式与...
摘要:“啤酒+尿布”的发现为商家带来了大量的利润,但是如何从浩如烟海却又杂乱无章的大数据中,发现啤酒和尿布销售之间的联系呢?
故事背景:
在一家...
优秀的数据可视化依赖优异的设计,并非仅仅选择正确的图表模板那么简单。全在于以一种更加有助于理解和引导的方式去表达信息,尽可能减轻用户获取信息的成本...
Hadoop安装手册1-基础扫盲及准备工作 Hadoop安装手册2-Hadoop环境配置 Hadoop安装手册3-启动Hadoop基础服务Hadoop安装手册4-添加与删除Hadoop节点&...
从1991年Tim Berners-Lee发明了万维网(World Wide Web)开始,到20年后2011年,互联网真正走向了一个新的里程碑,进入了“大数据...
演讲人:吴甘沙 英特尔中国研究院院长兼首席工程师素材来自:经管之家(bbs.pinggu.org) 组织“中国数据分析师行业峰会”。亲爱的各位同仁,各位同学,早上好。...
当大数据即Big Data与云计算、移动应用与社交网络风靡一世,成为近几年信息技术领域最时髦的词汇。IBM 、Oracle、SAP、微软等厂商,像寻找到了新的金矿,开始...