使用数据库记录日志的方式,我没有使用过,一般都是使用日志文件来记录job的执行情况。可以通过如下的方式来指定日志文件生成的路径 获取调度执行的时间,我这里是按照...
2015-10-25 10:35 回复了该问题Kettle设置开机自启动是什么情况啊?非要开机自启动,在Linux可以使用chkconfig,windows下拖到启动任务里面就可以。
2015-09-06 10:31 回复了该问题由于hadoop是拿Java来实现的,所以可以使用JPS命令来查看hadoop的服务器进程,如下图所示 [attach]6076[/attach] 在一...
2015-09-22 17:33 回复了该问题在天善的资料下载里面有相关的电子书: 链接地址如下:[url]http://www.flybi.net/article/506[/url] 有空的时候可以多来天...
2015-09-22 17:35 回复了该问题不想做程序员的数据分析师不是好的职业规划。 选择哪个方向,这真要看你的兴趣,个人推荐统计,应用数学之类的,未来几年数据挖掘还是可有为的。 另外,我想说的是现在复...
2016-04-21 10:33 回复了该问题为什么会有如此奇怪的需求。参考如下两种方案: 1.将你的hive表的数据导出到一个文件,然后复制100行记录,然后再导入hive中 2.找到hive在hdfs的...
2015-10-26 07:56 回复了该问题1.首先最起码要做的,就是一个监控日志的收集,这个在本周五的微信直播里面会讲。 2.运维分为系统运维和应用运维,系统运维就是分析系统的各项指标,对系统优化提供参...
2015-12-01 20:28 回复了该问题如果你的主/明细表数据量都比较小,用哪种方式都无所谓 如果你的主/明细表都非常大,最好是分开,先抽取主表数据,然后再抽取明细表数据。如果特别大,可能还需要分段抽...
2015-10-26 07:59 回复了该问题每次遇到这种问题,我都是想说。具体问题具体分析。 如果你的单机性能很低了,那可以尝试分库。 如果是查询比较慢,可以优化索引,优化表结构。 单表2000多万条记录...
2015-09-06 14:11 回复了该问题针对你这个问题,特意写了一篇博客,地址如下: [url]http://www.flybi.net/blog/marey_marey111/2063[/url] ...
2015-10-12 14:02 回复了该问题既然是保存到本地了,肯定是以字符串或者序列化的方式保存啊。 两种方式: 1.重新解析这个字符串,还原回二维数组 2.通过序列化和反序列化的方式,将变量的值还原回...
2016-08-09 12:37 回复了该问题我这边现在的做法是,刷新前,使用MDX对经常使用的Cube进行计数统计,刷新后,再使用MDX进行计数统计,判断两次统计Count值是否一致,并且后一次的不能为0...
2013-11-18 19:38 回复了该问题难度这个问题,比较难回答,会者不难。简单的说一下可能涉及到的东西。 1.linux :基于开源的东西,就不要想windows了,老老实实用linux,即使出了问...
2015-09-28 09:19 回复了该问题