前言先来简短的回顾一下决策树原理:决策树学习的算法通常是一个递归地(根据某一准则,信息增益或基尼系数)选择最优切分点/特征,并根据该特征对训练数据集...
作者:Ilan Reinstein来源:KDnuggets参与:Cynthia、大伟、周剑翻译:本文为天善智能编译,未经容许,禁止转载。想要深入了解机器学习与AI 并非易事。许多满...
作者:文文个人公众号:小小挖掘机(ID:wAIsjwj)前文传送门:数据城堡参赛代码实战篇(一)---手把手教你使用pandas关注Python爱好者社区,回复"数据代码",...
相信经常做数据分析的同学都听说过Cohort 分析,特别是互联网运营中,用于分析客户存留等场景,以往这种分析大都借助SQL+Excel完成。最近在尝试学习 Cohort ...
RFM模型是市场营销和CRM客户管理中经常用到的探索性分析方法,透过模型深入挖掘客户行为背后的价值规律,进而更好地利用数据价值推动业务发展和客户管理。RFM...
AHP (Analytic Hierarchy Process)层次分析法是美国运筹学家Saaty教授于二十世纪80年代提出的一种实用的多方案或多目标的决策方法。其主要特征是,它合理地将...
本文目标:本文的内容是对excel统计结果反推计算过程加深理解,后续会写多列的计算。《一元(多元)线性回归分析之Excel实现》帖子阅读后,发现excel中很多统...
前言遍历策略是爬虫的核心问题,在爬虫系统中,待抓取URL队列是很重要的一部分。待抓取URL队列中的URL以什么样的顺序排列也是一个很重要的问题,因为这涉及到...
作者:文文个人公众号:小小挖掘机(ID:wAIsjwj)最近参加了数据城堡(http://www.pkbigdata.com/)举办的“大学生助学金精准资助预测”比赛,分组第19名的成绩...
作者: 星星在线 Python爱好者社区专栏作者简书地址:https://www.jianshu.com/u/680e0e38ddc9前几天跟同事聊到最近在看什么小说,想起之前看过一篇文章说的是...
博客写了一年多了,也积攒了100+文章分享感谢大家陪我一起学习每次在评论区看到你们的疑问和鼓励,我甚是欣慰在部分文章最后留有一些问题,大家都会踊跃给出...
前言进阶部分连载继续~如果还没看过我的入门连载部分,先看:https://ask.hellobi.com/blog/wangdawei/10288当然,小编的免费入门课程已经有咯,看过连载的朋...
引言【算法趣题】是来自图灵程序设计丛书绝云译的《程序员的算法趣题》,书中是用Ruby实现的。这里是用python来实现。问题描述字母算式,就是用字母表示的算...
消失了一段时间,这段时间在CSDN阅读了不少关于Python爬虫的文章,也学习了秦璐老师《七周成为数据分析师》系列的Python内容,主要是关于强大的pandas,后面...
引言【算法趣题】是来自图灵程序设计丛书绝云译的《程序员的算法趣题》,书中是用Ruby实现的。这里是用python来实现。问题描述平方根,又叫二次方根,表示为...