你得有多恐惧算法啊,程序员没必要变成数学达人,你研究一下理念就好了。 比如你可以专研一个算法,比如knn,从knn的概念开始理解,然后把数据公式转成伪代码,后面...
2015-11-30 12:47 回复了该问题用户画像和指标这一块,重点还是在数据收集,指标目前行业也有比较成熟的定义了,主要是人员信息、社会属性及消费行为。 这些指标自然是我们注册会员时候要求填写的啊,部...
2015-11-27 18:17 回复了该问题这位哥们是说做挖掘类的数据探索吗?数据收集就是爬虫去取,用Python写个爬虫~ 目前我这边不会去从别的公司去拿数据,公司内的数据已经满足现有的挖掘需求了。 数...
2015-11-27 18:03 回复了该问题excel用用就会了,不用刻意去学,基本的还是要会的,matlab更偏向数学,你有这个功底学其他的更快。 建议你学学Python或者R,Python比较容易上手...
2015-11-27 16:50 回复了该问题提供业绩是指的哪一方面?是说公司的KPI考核还是营收状况? 旅游行业的核心是:旅游产品、订单、会员、人员架构、渠道、库存、财务、客服、客户端、分公司等 还有一些...
2015-11-27 16:47 回复了该问题这个问题太大了,都可以写几篇大论文了。 简单说一下,目前的算法都有各种应用,只是行业不同而已哦。 按照机器学习的分法,最常见的分类就是有监督学习、无监督学习、半...
2015-11-27 16:38 回复了该问题首先说明一下推荐系统是有精度的,一般来说精度在70%以上就算很牛X了。给一个老总去推荐酒店这个情景我们可以分析一下: 1、要明确这个老总的用户标签,消费情况、个...
2015-11-27 15:47 回复了该问题大数据自然是大,就比如:以前10台机器处理数据,现在需要30台,以前需要10个小时,现在需要3个小时。把数据处理的压力放在硬件上了,并且有效率提升,这是其一。 ...
2015-11-27 15:32 回复了该问题有相关的产品,但是不好提供,方向是从传统的报表开发转向KDD的方向,从BI做到BA,目前做的产品类似如GA流量分析系统、数据魔方这种,从单个报表的开发到系统集成...
2015-11-27 15:25 回复了该问题如果想从医疗行业进入在线旅游行业的话,其实并不难,主要是技术要掌握较好,目前的旅游公司相对而言要求数据处理能力较高,已从传统的数据库转向开源的数据文件处理方式。...
2015-11-27 15:20 回复了该问题多个自变量线性相关,多重共线性啊,结果应该就这几个: 1、部分检验失效,比如变量的显著性检验 2、得到的参数估计值失效 3、模型的预测失效 以上的问题都是相关联...
2015-11-27 10:53 回复了该问题一个调度起来,会按照需求分配几个map和reduce啊,这个要看某些reduce的依赖,如果依赖的map执行完了,reduce会执行,但是整体调度的reduce...
2015-11-27 09:41 回复了该问题支持向量回归 就是把实际问题通过非线性变换转换到高维的特征空间,通过升维后,在高维空间中构造线性决策函数来实现线性回归,选择不同的核函数,可以生成不同的SVM。
2015-11-26 12:00 回复了该问题