前言总是被很多的人问,为什么用R语言做量化投资,R、Python、Matlab比起来哪个更好?其实,答案很简单,你哪个用的熟就用哪个,工具是用来提升效率的,结果...
R Notebooks 的出现,必将为 R Markdown增添一个强大的创作引擎。在数据分析领域,R Notebooks 具有极为引人注目的优势!以下为相关内容快报...
The RStudio IDE 最新版本1.0已经发布,经过多个重要版本的迭代,增加了很多核心功能:创建项目、R包创建等,同时也有很多小功能并不明显,本文主要简单展示...
概述和Python计算环境中的tushare包一样,在R中我们使用quantmod包接入第三方数据源,实现自定义量化分析平台的构建。本文打算以陌陌的股票分析为背景,介绍...
2016年11月,Jeroen Ooms在CRAN发布了tesseract包,实现了R语言对简单图片的文本提取、分析功能。利用开源OCR引擎进行图片处理,目前可以识别超过100种语言,...
一、决策树的发展决策树是目前比较流行的一种分类算法,实质上是一种自上而下的归纳学习算法。该算法最早由Quinlan在1986年提出,当时称为ID3算法,该算法是...
数据越来越全,决策者越来越懒,因此数据可视化越来越受到重视。“全样本+可视化”的模式,正在渐渐替代传统的“描述+推断”的统计分析。说实话,Excel中的图表制...
1.引言本周在刷微博的时候看到一篇博文叫做《一个农村女孩的自由》,写的真实感人,其内容折射出了中国农村很长一段时间的现状。人生的选择很多,选择代表了...
前些日子,一位贾姓朋友加我微信,问R语言中数据管理的问题,其实多多少少在前面的几篇文当中都有涉及了,今天索性来个系统的介绍,以抛砖引玉,还请各位大神...
希望你不仅能从中学到新的技能和极具创新的工具,更能从中结合你自己的业务有新的发现。 1. Infogr.am 在Infogr.am网站中,你可以使用30多种图形和...
前言Python编程灵活方便,R的模型方法众多,如何将两者结合起来,发挥更大的作用,值得探索。以下是10个最常用的机器学习算法,这些算法使用了Python和R代码...
一、文本挖掘定义文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法。文本挖掘中最重要最基本的应用是实现文本的分类和聚类,前...
Twitter是一个流行的社交网络,这里有大量的数据等着我们分析。Twitter R包是对twitter数据进行文本挖掘的好工具。 本文是关于如何使用Twitter R包获取twitte...
Sharp Sight Labs 近日在 r-bloggers 上发表了一篇文章,论述了为什么当今的数据科学工作者应该学习 R 语言的原因。为了给大家提供一个明晰的对比,我们在后...
R语言里面一个比较重要的绘图包——ggplot2,是由Hadley Wickham于2005年创建,于2012年四月进行了重大更新,作者目前的工作是重写代码,简化语法,方便用户开...