brucelu

大数据、数据仓库、数据挖掘均有涉猎

始于: 2013-06-27

江苏省 南京市

发私信

1250

总声望

149

次被推荐

41

粉丝

他的回答
排序:

0
投票

mahout有里面很多计算机算法,我们是程序员又不是数学家,对着算法恐惧怎么办?

你得有多恐惧算法啊,程序员没必要变成数学达人,你研究一下理念就好了。 比如你可以专研一个算法,比如knn,从knn的概念开始理解,然后把数据公式转成伪代码,后面...

2015-11-30 12:47 回复了该问题
2
投票

如何跟进用户画像及对应的指标,结合到现有业务给用户推荐旅游路线

用户画像和指标这一块,重点还是在数据收集,指标目前行业也有比较成熟的定义了,主要是人员信息、社会属性及消费行为。 这些指标自然是我们注册会员时候要求填写的啊,部...

2015-11-27 18:17 回复了该问题
2
投票

旅游行业数据收集的渠道,方式,数据准确性怎么验证。还有数据预处理的过程有哪些,怎么做,发现异常数据怎么处理,是直接删除,还是经过数据清洗。怎么清洗

这位哥们是说做挖掘类的数据探索吗?数据收集就是爬虫去取,用Python写个爬虫~ 目前我这边不会去从别的公司去拿数据,公司内的数据已经满足现有的挖掘需求了。 数...

2015-11-27 18:03 回复了该问题
0
投票

MATLAB、Python、excel之间的取舍?

excel用用就会了,不用刻意去学,基本的还是要会的,matlab更偏向数学,你有这个功底学其他的更快。 建议你学学Python或者R,Python比较容易上手...

2015-11-27 16:50 回复了该问题
1
投票

旅游行业如何提供业绩,从哪些方面入手呢?要建怎么样的模型?

提供业绩是指的哪一方面?是说公司的KPI考核还是营收状况? 旅游行业的核心是:旅游产品、订单、会员、人员架构、渠道、库存、财务、客服、客户端、分公司等 还有一些...

2015-11-27 16:47 回复了该问题
2
投票

在机器学习方面最经常用的算法有哪些?

这个问题太大了,都可以写几篇大论文了。 简单说一下,目前的算法都有各种应用,只是行业不同而已哦。 按照机器学习的分法,最常见的分类就是有监督学习、无监督学习、半...

2015-11-27 16:38 回复了该问题
1
投票

在旅游行业中如何根据不同的人群进行精准的酒店推荐匹配?

首先说明一下推荐系统是有精度的,一般来说精度在70%以上就算很牛X了。给一个老总去推荐酒店这个情景我们可以分析一下: 1、要明确这个老总的用户标签,消费情况、个...

2015-11-27 15:47 回复了该问题
0
投票

大数据时代对旅游业最大的帮助体现在哪?拜托各位了 3Q

大数据自然是大,就比如:以前10台机器处理数据,现在需要30台,以前需要10个小时,现在需要3个小时。把数据处理的压力放在硬件上了,并且有效率提升,这是其一。 ...

2015-11-27 15:32 回复了该问题
0
投票

旅游行业如何做数据可视化分析,有没有案例参考,求分享学习

有相关的产品,但是不好提供,方向是从传统的报表开发转向KDD的方向,从BI做到BA,目前做的产品类似如GA流量分析系统、数据魔方这种,从单个报表的开发到系统集成...

2015-11-27 15:25 回复了该问题
0
投票

想咨询一下,如何更快进入这个行业,我指的是数据智能或数据架构这方面的内容。我本人原为软件开发人员,现处于医疗行业。在一家小公司任IT负责人。谢谢!

如果想从医疗行业进入在线旅游行业的话,其实并不难,主要是技术要掌握较好,目前的旅游公司相对而言要求数据处理能力较高,已从传统的数据库转向开源的数据文件处理方式。...

2015-11-27 15:20 回复了该问题
0
投票

大数据技术在智慧旅游行业中如何应用

目前旅游行业,主要有这几方面的应用:搜索引擎、产品推荐、流量分析、库存预警、会员精准营销 主要是大数据量的一些处理

2015-11-27 15:17 回复了该问题
2
投票

预测变量之间存在部分属性存在线性相关会带来一些什么问题

多个自变量线性相关,多重共线性啊,结果应该就这几个: 1、部分检验失效,比如变量的显著性检验 2、得到的参数估计值失效 3、模型的预测失效 以上的问题都是相关联...

2015-11-27 10:53 回复了该问题
1
投票

为什么mapper没有全部跑完,reducer就已经有结束了?

一个调度起来,会按照需求分配几个map和reduce啊,这个要看某些reduce的依赖,如果依赖的map执行完了,reduce会执行,但是整体调度的reduce...

2015-11-27 09:41 回复了该问题
1
投票

数据挖掘中类别不均衡问题如何处理

你的抽样比例是如何分配的?或者说的你抽样方法怎么选取? 如果比例太少你可以试试等比例抽样,或者稀疏抽样

2015-11-26 13:35 回复了该问题
1
投票

如何通俗易懂地解释支持向量回归(support vector regression)?

支持向量回归 就是把实际问题通过非线性变换转换到高维的特征空间,通过升维后,在高维空间中构造线性决策函数来实现线性回归,选择不同的核函数,可以生成不同的SVM。

2015-11-26 12:00 回复了该问题

改版

反馈