天善智能

专注商业智能,致力推动商业智能技术的普及与发展。

始于: 2015-10-03

发私信

9770

总声望

1001

次被推荐

0

粉丝

他的回答
排序:

0
投票

最近做个问卷调查,不知道用统计分析做报告还是数据挖掘?

Shadow 杨:@深圳-数据分析(Mr yang) 多少样本 夏尔康:@深圳-数据分析(Mr yang) 问卷需要挖掘什么,尽管根据你的调查数据说话。 J...

2015-12-06 19:25 回复了该问题
1
投票

一般做日志采集ELK主要还是对应用服务器日志简单分析下UV PV流量等常规指标!要贴合实际业务的还是要靠埋点。但业务系统对埋点js还是不太乐意接受?

同程吴文波:app的埋点确实是需要的。业务系统如果要进行js埋点,那么你的js应该是一个组件。

2015-12-06 19:24 回复了该问题
0
投票

学习数据分析,感觉软件太多,基础要用到统计学,sql采集语句,数据仓库等,不知道哪些是要先学?

Echo:我觉得学习统计的话就可以走算法路线 做研发,,不需要数据库方面的知识,对吗? 天天向上:@轩子 优先SQL.这个到时候会用到。 Shadow 杨:...

2015-12-06 19:22 回复了该问题
0
投票

大数据方向有哪些技术或哪些职位?

天天向上:与大数据有关的:云计算,Hadoop运维工程师,开发工程师,数据分析,数据挖掘工程师。正在做的有爬虫,推荐,用户行为等等。

2015-12-06 19:22 回复了该问题
0
投票

对于初学者学数据分析有没有推荐的书籍?

梁勇:想要做数据分析的话可以看的书——基础篇 http://www.flybi.net/blog/CNDT87/2557,Shadow杨的博客上面很多,菜鸟数...

2015-12-06 19:21 回复了该问题
0
投票

关于使用spark做olap靠谱么?有没有成熟案例?

同程吴文波:spark做olap? 天天向上:@大连-K12-王东 spark现在还是一种计算框架 。。 王东:greenplum和spark选型如何取舍呢...

2015-12-06 19:19 回复了该问题
0
投票

我们的关系数据库中有些对象是hadoop不支持的,而且数据表多,字段多,相对数据量倒不大,做过一些简单的测试,比如说查询,效率还不如关系数据库。

同程吴文波:@内心召唤 不要盲目上Hadoop或其他的大数据。 春宇:@内心召唤 先用关系型数据库吧,GP都开源了,一般的都能搞定 同程吴文波:恩,我自己搭...

2015-12-06 19:17 回复了该问题
0
投票

我们的系统日志因为历史原因现在都写文件里面了,这个能不能不改系统直接pipe到flume呢?

天天向上:可以的,直接读一下就可以的。

2015-12-06 19:14 回复了该问题
0
投票

有些电商系统总是推荐用户已经购买过的同类商品,如何使系统推荐关联商品而非相似商品呢?希望做过的讲一下,采用的什么算法?

同程吴文波:@深圳-DM-海原 我做过此类的。 海原星宿:@同程吴文波 是事先将每一种商品都编写一个关联规则吗?  同程吴文波:@深圳-DM-海原 不需要每...

2015-12-06 19:13 回复了该问题
0
投票

第一、二类产业如何开展大数据建设?

同程吴文波:像这种情况,你应该直接给领导出一份数据分析报告,然后告诉他这是大数据的结果。分析报告可以使用spss,R语言来完成。 内心召唤:我们是石油开采行业...

2015-12-06 19:08 回复了该问题
1
投票

有个关于mongodb的问题,就是当主从复制集,主集按照某个索引条件删除大量数据时,瞬间完成。但是从集却是按id一条一条删除,导致长时间主从数据不一致,这个大家有遇到过吗?

小小蜗牛爬上墙:对于mysql主从复制,在生产环境我们是不允许的 高不高:@小小蜗牛爬上墙 ,为什么不允许? 小小蜗牛爬上墙:因为binlog没法保证sla...

2015-12-06 19:07 回复了该问题
0
投票

请说说大数据的核心是什么?有一种观点,不上hadoop就不是大数据,你如何看这个问题?

天天向上:我个人理解的核心还是有价值,如何从海量的数据中提取出基于业务的,并且有市场前景的价值。hadoop只是一种数据存储和计算解决方案。mysql的大集群也...

2015-12-06 19:06 回复了该问题
0
投票

我想问一下收集日志是将原数据保存再压缩吗?

铮:一般压缩为什么格式? 天天向上:@铮 看你的场景。。最近的日志不压缩,归档需要压缩。 同程吴文波:@铮 我们是直接收集网络点击日志,存储在Hadoop的...

2015-12-06 19:05 回复了该问题
0
投票

我想问一下,具体分析日志和转化的问题,如何进行的?

高不高:我们公司有点像YY,但是一直推不下去这块。 同程吴文波:你问到点上了。这个需要结合前端的埋点,后端的分析,业务的规则来定。 高不高:嗯,运营那边要数...

2015-12-06 19:05 回复了该问题
0
投票

业务数据可以用mongo存储吧 如果用mogo 会导致什么风险吗?相对于mysql来说。

同程吴文波:我们不建议用nosql来存储带事务的交易数据。我们也是将一些资源,例如政策数据同步存储到nongo。 天天向上:@北京-hylink-Hao,Wi...

2015-12-06 19:03 回复了该问题

改版

反馈