大数据百家争鸣,老实说选哪个都不是明智选择,举个例吧,比如说现在最火红的是Spark,但是Hadoop 也说他出3.0 后会比Spark 快10 倍,所以这个技...
2016-07-27 15:01 回复了该问题David Chiu:实际上我们很少动到算法, 多半动到的是特征(Feature Engineering) 以及参数的挑选, 以及必须要根据数据特征挑选算法, ...
2016-07-27 15:02 回复了该问题David Chiu :Matlab 要钱, R 不用, 你用的Matlab 有付过钱吗? 伟:百度的吴恩达很推崇Matlab,也许是因为他之前在斯坦福教书不...
2016-07-27 15:03 回复了该问题David Chiu: library(rvest) house = read_html('http://www.qk365.com/list/a16-k217...
2016-07-27 15:04 回复了该问题David Chiu:低频次吗? 是所发生的特别少吗? 伟:比如10秒一个数据,有时间,车辆编码,瞬时速度,瞬时里程等等,里程是逐步增长的,还有经纬度等信息,...
2016-07-27 15:06 回复了该问题David Chiu:SparkR 会是你的好朋友,RMPI 也不错, 但会single point failure,如果要考虑到地理咨询的话,可以用spati...
2016-07-27 15:07 回复了该问题David Chiu:自变量跟因变量的取样频率不一样? 是分开取的吗, 怎么会不一样? 曹敏:比如说对生产过程中的某个属性,取样频率是10分钟一次,但是最后的...
2016-07-27 15:08 回复了该问题叶鹏:是的 David Chiu:这用spark streaming 叶鹏:这种研究您怎么评价?有没有成功案例? David Chiu:还是使用RMSE...
2016-07-27 15:11 回复了该问题张丹:R的优势,就是在数学计算,数据处理上。但另外,我们从开发或使用的角度,更多的用到的R包,都是rstudio公司的产品,我觉得是rstudio在推动R的整个...
2016-07-04 10:35 回复了该问题[b]张丹: [/b]你所说的统计,只能说简单计数。比如,你要预测下个月的考勤情况,从而设计预算。你可能就需要做个,回归分析,这时R就能给你很大的帮助了。
2016-07-04 10:35 回复了该问题[b]张丹:[/b]R和python比,R更面向数据,特别是对于没有编程基础的人。PYTHON,还是程序语言,还要了解程序结构,程序架构,代码量不会少。有IT背...
2016-07-04 10:36 回复了该问题