David Chiu:低频次吗? 是所发生的特别少吗? 伟:比如10秒一个数据,有时间,车辆编码,瞬时速度,瞬时里程等等,里程是逐步增长的,还有经纬度等信息,...
2016-07-27 15:06 回复了该问题David Chiu: library(rvest) house = read_html('http://www.qk365.com/list/a16-k217...
2016-07-27 15:04 回复了该问题David Chiu :Matlab 要钱, R 不用, 你用的Matlab 有付过钱吗? 伟:百度的吴恩达很推崇Matlab,也许是因为他之前在斯坦福教书不...
2016-07-27 15:03 回复了该问题David Chiu:实际上我们很少动到算法, 多半动到的是特征(Feature Engineering) 以及参数的挑选, 以及必须要根据数据特征挑选算法, ...
2016-07-27 15:02 回复了该问题大数据百家争鸣,老实说选哪个都不是明智选择,举个例吧,比如说现在最火红的是Spark,但是Hadoop 也说他出3.0 后会比Spark 快10 倍,所以这个技...
2016-07-27 15:01 回复了该问题David Chiu :是这样的,我们发现使用者是否购买,跟在一个session 中看的商品次数有关,因此如果有一个使用者看了同款笔电两次,我们会请前端再打一次...
2016-07-27 15:00 回复了该问题David Chiu:R 只是语言工具,他当然可以存取Hadoop 中的HDFS。 如果是使用商业版的R,你可以参考RHadoop 项目,微软的RevoR 也支...
2016-07-27 14:58 回复了该问题David Chiu:APP 里面也是用HTTP 请求去要求数据,所以也可以去抓取 但是因为他的接口藏在APP中,所以一般我们会先反组译APP,然后用wires...
2016-07-27 14:56 回复了该问题David Chiu:地理坐标很容易读取, 因为都是用javascript 贴上去的, 所以只要找到javascript 的位置就好. 爬虫是只要看的到就爬的到...
2016-07-27 14:54 回复了该问题David Chiu:以往舆情分析专注在于用声量了解民声,但我觉得这根本不通, 重点是要摘要出民众讨论的议题有哪些. 给个范例: 今天有些人在商城上购买电饭锅,...
2016-07-27 14:44 回复了该问题IVAN刘振华 :关于店铺改版的分析,我个人用得比较多的,便是热力图。 一般是每7天观察一次。而且是在闲日的时候
2016-07-18 19:15 回复了该问题IVAN刘振华:兄弟,我做竞品一般都不用阿里的生意参谋的。一般我会用第三方数据软件,同时也用免费的,比如阿里指数、百度指数。
2016-07-18 19:14 回复了该问题