大数据

  从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。大数据的4个“V”,或者说特点有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。前文提到的网络日志、视频、图片、地理位置信息等等。第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。

0
推荐
1733
阅读

是我太浮躁,还是工作太无趣

来自爱米的提问:我入职快三个月了,但是发现干的不是自己喜欢的工作。每天都是重复,枯燥,没什么能提高的。我有离职的想法,想去做别的工作。但是我怕是不...
0
推荐
2151
阅读

如何利用Python网络爬虫爬取微信朋友圈动态——附代码(下)

前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往下继续深入。一、代码实现1...
2
推荐
9924
阅读

【Python金融量化】VaR系列(三):DCC模型估计组合VaR

作者:量化小白H     Python爱好者社区专栏作者个人公众号:量化小白上分记前文传送门:【Python金融量化】VaR系列(一):HS,WHS,RM方法...
3
推荐
2203
阅读

Apache Kylin v2.4.1 正式发布

Apache Kylin社区于日前宣布:Apache Kylin v2.4.1 正式发布!欢迎大家下载使用。Apache Kylin 是一个开源的分布式分析引擎,提供 Hadoop 之上的 SQL 查...
0
推荐
2670
阅读

CDH安装系统环境准备——系统版本和安装包下载地址指南

由于Hadoop深受客户欢迎,许多公司都推出了各自版本的Hadoop,也有一些公司则围绕Hadoop开发产品。在Hadoop生态系统中,规模最大、知名度最高的公司则是Cloud...
0
推荐
1506
阅读

Python or Java?大数据解读学什么语言最赚钱

作者:徐涛19年应届毕业生,专注于珊瑚礁研究,喜欢用R各种清洗数据。知乎ID:parkson本文主要用Python爬取拉勾网不同编程语言职位信息,包括:Python岗、Jav...
0
推荐
1508
阅读

回顾 | Meetup海外行:Kyligence参加Google Meetup@加州

美国西部时间8月29日,Kyligence USA 以一场给力演讲,在加利福尼亚州完成了其北美市场的公开首秀!当天,由 Google 赞助和主办、Big Data Application ...
0
推荐
1819
阅读

Kyligence 体验篇 | 实习4个月,我成为Kylin Contributor

加入一家大数据公司是什么体验?在 Kyligence 能学到什么?这里的工作氛围如何?来听听开源Team的她怎么说! 作为一枚2017级的研二学生(浙江大学软件工...
0
推荐
1350
阅读

DataPipeline加入Linux基金会下OpenMessaging社区

近日,国内领先的“iPaaS+AI”一站式大数据融合服务提供商DataPipeline宣布加入Linux基金会旗下OpenMessaging开源社区,将与OpenMessaging开源社区其他成员阿里...
0
推荐
1554
阅读

Kyligence 上榜“2018中国大数据准独角兽”TOP30

日前,由i黑马旗下的企业服务垂直媒体 B2B 圈与中国中小企业协会高新技术产业分会等联合发起的“2018中国大数据硬(准)独角兽榜”正式公布,Kyligence 凭借领...
0
推荐
1854
阅读

Kyligence 宣布支持Google云平台,助力企业云上大数据分析亚秒级响应

日前,Kyligence 宣布旗下云端一站式大数据分析解决方案 Kyligence Cloud 正式支持 Google 云平台(Google Cloud Platform),为&n...
0
推荐
2630
阅读

DataPipeline | PayPal庞姬桦:大数据在小微企业贷款上的运用

庞姬桦女士毕业于北京大学和美国哥伦比亚大学,目前担任PayPal公司消费者风险管理总监,负责通过大数据实现对互联网金融风险的侦测、跟踪、管控和防范。在加...
1
推荐
2455
阅读

DataPipeline |《Apache Kafka实战》作者胡夕:Apache Kafka监控与调优

胡夕,《Apache Kafka实战》作者,北航计算机硕士毕业,现任某互金公司计算平台总监,曾就职于IBM、搜狗、微博等公司。国内活跃的Kafka代码贡献者。前言虽然...
0
推荐
2083
阅读

还不会处理时间数据?看这篇就够了

如何统一时间格式?于统计来源的不同,或者记录数据人员的错误,会导致日期格式各种各样。下面表格是从我公众号里导出的excel数据。标题列是发布文章的题目,...
0
推荐
3363
阅读

贵州茅台(600519)股价预测——金融时序模型(ARIMA)

作者:我叫丶钱小钱     Python爱好者社区专栏作者简书专栏:https://www.jianshu.com/u/7e54016a5a06最近无论同事也好,朋友也好,都提到一只股票...

1966 人关注

最佳回复者

改版

反馈