天善小编

微信直播问题收集

始于: 2015-05-03

湖南省 怀化市

发私信

139

总声望

30

次被推荐

0

粉丝

她的回答
排序:

0
投票

比如做车辆轨迹分析和时间预测这块,需要应用到的技能都会有哪些呢

轨迹是指预测吗?时间预测的话,这些python都有专门的库,掌握好pandas,scikit,spark mllib都很有用。

2016-07-10 22:30 回复了该问题
0
投票

从数据处理角度讲,python和R只要深入研究一种就可以了吧?

云戒:如果从数据处理角度来讲,学python比R更好。

2016-07-10 22:29 回复了该问题
0
投票

大数据和云计算的基础书籍那些值得一看?

云戒:还是要分清楚哈,大数据和云计算并不太一样哦。搞数据的以大数据方面的书为主。大数据以spark和hadoop为核心,找些这方面的书箱来看即可。

2016-07-10 22:27 回复了该问题
0
投票

请问,对于几百万行的数据,用r建模经常收到内存限制,有什么办法可以解决吗

[b]张丹:[/b]R的机制,会把数据一次性加载到内存中。就算能读到内存,每次计算时,也会有中间变量,所以你的基础内存是不够的。而且对于win性能会更差。

2016-07-04 10:43 回复了该问题
0
投票

R的优势是什么?

[b]张丹:[/b]R是免费开源的,有6000多个包,遍布各行各业。R语言的3个特性,数学计算,数据建模,可视化。 

2016-07-04 10:41 回复了该问题
0
投票

有好的spark或者hadoop入门的书吗,计算机能力弱和java不懂啊

[b]张丹:[/b]hadoop有很多书了,我当初看的是 权威指南。hadoop的MR的原理要了解,找到懂JAVA的同事,帮你把环境搭好。

2016-07-04 10:41 回复了该问题
0
投票

想听听丹哥对传统数据挖掘转量化投资的建议。比如前景?竞争力?

[b]张丹:[/b]量化投资,其实是IT人都想转的行业。你写的代码,不是通过工资来赚钱,而直接通过交易赚钱。代码的效用是最大化的。这个行业竞争很大,聪明人都在这...

2016-07-04 10:40 回复了该问题
0
投票

RHaoop采用分布式并行计算,那请问如何解决需要嵌套循环的算法。

[b]张丹:[/b]对于基于hadoop大数据的MR计算,建议做数学变成,通过数学的角度处理。我写过2个例子,一个是pagerank, 一个是itemcf。

2016-07-04 10:39 回复了该问题
0
投票

python有pandas.DataFrame,pandas应该是第三方的数据库结构吧?R的data.frame是内置的。

[b]张丹:[/b] pandas.DataFrame,在底层处理,还需要对原PYTHON的数据结构做映射。当然他可以解决的很好,但你看到的内存结构,可能并不...

2016-07-04 10:38 回复了该问题
0
投票

最近想研究一些互联网文本数据与指数或各股走势的关系,但是在使用R语言处理文本数据不是很方便,丹哥可有一些强大的library推荐,对于非结构,文本数据的处理。

[b]张丹:[/b] “尽量使用向量计算或矩阵计算的计算方法",可以这样理解,对于一个二维结构,for需要2次,0(N^2)的时间复杂度。如果我们把数...

2016-07-04 10:37 回复了该问题
0
投票

:请教一个问题:quantmod对美股的实时接口很好用,对A股不支持,且A股基本面数据才更新到2013.09,请问有好用的ETL包么,类似于python的tushare那样对A股友好的,各种etl啊清洗的脏活累活感觉python更好啊,R就是安安静静做做统计,玩玩图形。

[b]张丹:[/b] quantmod使用的是yahoo等国外的数据源,这些数据源本身没有A股数据,如果需要A股数据,用tushare还是不错的。 R特有的da...

2016-07-04 10:36 回复了该问题
0
投票

r在拟合上感觉比python用起来更爽一些,其返回的结果较多

[b]张丹:[/b]R和python比,R更面向数据,特别是对于没有编程基础的人。PYTHON,还是程序语言,还要了解程序结构,程序架构,代码量不会少。有IT背...

2016-07-04 10:36 回复了该问题
0
投票

我也觉得r语言不错,但经常想不到商业场景,到现在,我只是用它统计考勤,各种绩效kpi,每月算一次奖金,已经这样过去2年了,r语言,路在何方哪?

[b]张丹: [/b]你所说的统计,只能说简单计数。比如,你要预测下个月的考勤情况,从而设计预算。你可能就需要做个,回归分析,这时R就能给你很大的帮助了。

2016-07-04 10:35 回复了该问题
0
投票

现在有很多量化平台,提供打包好的函数,在线回测,和自己造轮子拿R语言相比,您觉得各有什么优势呢?

张丹:R的优势,就是在数学计算,数据处理上。但另外,我们从开发或使用的角度,更多的用到的R包,都是rstudio公司的产品,我觉得是rstudio在推动R的整个...

2016-07-04 10:35 回复了该问题
0
投票

微软对R的收购会对R语言的发展产生什么影响?

张丹:我觉得这是正向发展的,是好事情。大公司看到了R的潜力

2016-07-04 10:34 回复了该问题

改版

反馈