天善小编

微信直播问题收集

始于: 2015-05-03

湖南省 怀化市

发私信

139

总声望

30

次被推荐

0

粉丝

她的回答
排序:

0
投票

再请教个问题,也没有比较好的算法分析低频次数据,比如汽车的启动,行驶,等红绿灯的短停,如何精确计算每次的行驶时间,行驶里程,这还涉及到过滤掉一些错误数据的问题?

David Chiu:低频次吗? 是所发生的特别少吗? 伟:比如10秒一个数据,有时间,车辆编码,瞬时速度,瞬时里程等等,里程是逐步增长的,还有经纬度等信息,...

2016-07-27 15:06 回复了该问题
0
投票

能发下爬取房价的代码吗?

David Chiu: library(rvest) house = read_html('http://www.qk365.com/list/a16-k217...

2016-07-27 15:04 回复了该问题
0
投票

好早就听说Matlab做机器学习,能比较一下Matlab和R语言么?

David Chiu :Matlab 要钱, R 不用, 你用的Matlab 有付过钱吗? 伟:百度的吴恩达很推崇Matlab,也许是因为他之前在斯坦福教书不...

2016-07-27 15:03 回复了该问题
0
投票

老师,我想问一下,如果不懂算法源代码,不懂怎么修改算法,在建模的时候,建模预测比较准,但用来预测就不准了,这个是什么原因,比如用随机森林预测,怎么去调优模型呢?

David Chiu:实际上我们很少动到算法, 多半动到的是特征(Feature Engineering) 以及参数的挑选, 以及必须要根据数据特征挑选算法, ...

2016-07-27 15:02 回复了该问题
0
投票

老师能不能讲一下,如果学机器学习的话要学哪些技术? 而且还想知道大数据哪些技术比较有前途,或者说大数据的未来哪些方向是比较有潜力的?

大数据百家争鸣,老实说选哪个都不是明智选择,举个例吧,比如说现在最火红的是Spark,但是Hadoop 也说他出3.0 后会比Spark 快10 倍,所以这个技...

2016-07-27 15:01 回复了该问题
0
投票

判定树是什么

David Chiu :判定树是什么?我们叫Decision Tree 为决策树,判定树是Word 帮我翻译的。

2016-07-27 15:01 回复了该问题
0
投票

R 如何处理单机无法加载的大量数据?

David Chiu:几招,RMPI,RCPP. 'parallel' 或用商业版的R

2016-07-27 15:00 回复了该问题
0
投票

当发现有一个使用者重复看了这商品两次,我们便让前端再打一次,这个是什么意思啊?打什么标签?

David Chiu :是这样的,我们发现使用者是否购买,跟在一个session 中看的商品次数有关,因此如果有一个使用者看了同款笔电两次,我们会请前端再打一次...

2016-07-27 15:00 回复了该问题
0
投票

r语言和hadoop关系是什么样的?

David Chiu:R 只是语言工具,他当然可以存取Hadoop 中的HDFS。 如果是使用商业版的R,你可以参考RHadoop 项目,微软的RevoR 也支...

2016-07-27 14:58 回复了该问题
0
投票

机器学习一般用什么数据库?

David Chiu :哪一种数据库其实都好, 因为运算时还是要载到内存中。

2016-07-27 14:57 回复了该问题
0
投票

R可以爬取app的数据么?

David Chiu:APP 里面也是用HTTP 请求去要求数据,所以也可以去抓取 但是因为他的接口藏在APP中,所以一般我们会先反组译APP,然后用wires...

2016-07-27 14:56 回复了该问题
0
投票

1如何读取房子的地理坐标数据;2.搜房网等是不是设置了一些防止爬取的东东呀,怎么应付;3.如何在网页上爬到并整理自己需要的数据4.你做的房价分析的有代码例子吗

David Chiu:地理坐标很容易读取, 因为都是用javascript 贴上去的, 所以只要找到javascript 的位置就好. 爬虫是只要看的到就爬的到...

2016-07-27 14:54 回复了该问题
0
投票

将机器学习应用在文字处理上 这个能不能举个应用的例子?

David Chiu:以往舆情分析专注在于用声量了解民声,但我觉得这根本不通, 重点是要摘要出民众讨论的议题有哪些. 给个范例: 今天有些人在商城上购买电饭锅,...

2016-07-27 14:44 回复了该问题
0
投票

一些app在ui做出改变后,产品经理会做一些埋点分析,分析用户对改变的适应情况。同样在对店铺装修改变时,由于平台属于电商,我们是否有好的方法或者产品对用户行为进行跟踪?

IVAN刘振华 :关于店铺改版的分析,我个人用得比较多的,便是热力图。 一般是每7天观察一次。而且是在闲日的时候

2016-07-18 19:15 回复了该问题
0
投票

请教:阿里提供的竞争对手数据例如交易指数,指标公式比较模糊,是否仅能做一些趋势分析,没法做定量分析,如何用好这些数据与企业内部数据做对比?

IVAN刘振华:兄弟,我做竞品一般都不用阿里的生意参谋的。一般我会用第三方数据软件,同时也用免费的,比如阿里指数、百度指数。

2016-07-18 19:14 回复了该问题

改版

反馈