机器学习

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多推论问题属于无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。”

0
推荐
1461
阅读

0x12 模型评估,交叉验证

01 测试与训练机器学习的目的,就是要让程序从已知的数据中自己找出规律,然后将规律应用到未知的数据中去。不同于常规程序的步骤,由程序员事先设置好各种条...
0
推荐
1716
阅读

OpenCV installation

openCV 计算机视觉库Ubuntu 16 kylin下的安装过程,其实从链接搬运的,只是自己过了一遍有些不同的用汉语标注了。第三步libtiff4升级到5了第七步pip已经有了...
0
推荐
1745
阅读

Python:爬虫系列笔记(3) -- urllib库的高级用法

1.设置Headers有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们需要设置一些Head...
0
推荐
2334
阅读

Machine learning -- C4.5算法详解及Python实现

程序实现部分转自 Wsine的博客小站地址:http://www.cnblogs.com/wsine/p/5180315.html C4.5是一系列用在机器学习和数据挖掘的分类问题中的算法。它的目...
8
推荐
1645
阅读

机器学习初步学习笔记

机器学习初步机器学习基本概念机器学习、统计模型和数据挖掘有什么异同?机器学习和统计模型区别不是很大,机器学习和统计模型中的回归都一样,底层算法都是...
1
推荐
2339
阅读

如何准备机器学习工程师的面试?

我之前面试一些公司的机器学习或者数据挖掘工程师的职位。感觉自己准备的不够充分。想了解下一般会问哪些问题,考察哪些方面的东西??周开拓~~~~~~~~~~~~~~~...
7
推荐
2202
阅读

Python数据挖掘实践—KNN分类

1、最邻近算法KNN方法的简单描述:KNN方法用于分类,其基本思想如下。我们已经有一些已知类型的数据,暂称其为训练集。当一个新数据(暂称其为测试集)进入的...
0
推荐
1313
阅读

回归预测之入门

最近一段时间再看斯坦福大学几期学习的教学视频,有百度首席工程师、百度大脑以及百度研究院的负责人吴恩达教授讲述,内容深入浅出,推荐想踏入机器学习领域...
0
推荐
2110
阅读

NIPS 2016 深度学习paper

Deep ADMM-Net for Compressive Sensing MRIYan Yang, Xi'an Jiaotong University; Jian Sun*, Xi'an Jiaotong University; Huibin Li, ; Zongben Xu, S...
2
推荐
2091
阅读

亚线性时间复杂度近似k-means++

K-Means聚类算法的目标是找到一个由k个聚类中心构成的集合,使得所有样本点到距其最近的聚类中心之间的距离之和最小。为避免引起歧义,这里解释一下,目标函...
0
推荐
3172
阅读

浅谈L1与L2正则化

正则化方法 (Regularization) 是机器学习领域中一种非常重要的技巧,它主要用来对权重系数加以约束限制,进而防止过拟合。数学上来讲,正则化即为在目标函数...
1
推荐
1599
阅读

NIPS 2016 deep learning 论文摘读

NIPS 是机器学习领域的顶级会议之一,类似等级的顶级会议还有CVPR, ICCV, ICML, CIKM,IJCAI等。本次摘读论文题目是:Swapout: Learning an ensemble of deep...
0
推荐
1940
阅读

浅析logistic regression

逻辑回归是一种应用非常广泛的分类算法,同时也广泛地用于排序场景。如果样本集是线性可分的,逻辑回归是一个效果比较好的分类器。对于非线性特征,可以通过...
0
推荐
4106
阅读

random forests用于分类和回归的spark示例

紧接上文,本文谈谈随机森林。随机森林是由多个决策树集成得到的。它是一种比较成功地机器学习算法,不仅可以用于分类问题,也可以用于回归问题。随机森林通...
0
推荐
1475
阅读

记录我是如何转型大数据分析(二)——iris

在学习数据分析的过程中,iris数据算是我第一个接触的比较官方的数据来源。这是一个关于鸢尾花的数据,有五个属性:花瓣的长和宽、萼片的长和宽、花的三类。...

1588 人关注

最佳回复者

改版

反馈