storm kill topology-name 如果想在每个节点都停止某个服务: sudo service supervisord stop
2016-06-28 13:05 回复了该问题这个文件应该是在hbase 0.9*的jar中,例如0.92,0.94。 新的版本暂时未发现
2016-06-27 17:38 回复了该问题hadoop里面的分布式文件系统依赖很多Linux的基础服务。 其中就会用到rsync 而rsync是依赖 xinetd服务的。默认情况下,Linux(cent...
2016-06-27 17:15 回复了该问题你的数据量有10T,应该不是实时抽取。 如果数据量比较大,建议使用增量模式,并且数据同步工具改用sqoop来进行。
2016-06-12 11:09 回复了该问题因为hbase的底层是hfile,是二进制存储,与文件系统hdfs还是有不一样的
2016-06-12 11:06 回复了该问题hbase权限管理的配置: <property> <name>hbase.superuser</name> ...
2016-06-12 10:10 回复了该问题在hive中有row_number()函数,例如 row_number( order by uuid() ) uuid函数:select reflect(“ja...
2016-06-12 10:04 回复了该问题建议数据先在hadoop进行预处理,生成文本内容后再使用spark或hive进行后续的处理 在使用hadoop进行excel操作时,可能需要自定义input...
2016-06-12 09:56 回复了该问题最好是离线方式吧,例如ftp的方式。 hdfs方面的设置则要考虑数据块的大小、hdfs客户端超时时间等
2016-06-12 09:52 回复了该问题我这边的做法是自行开发元数据管理和数据监控程序。 在这个方面,市面还是比较少的,即使有也不够灵活,所以还是需要自行开发为好
2016-06-12 09:51 回复了该问题建议你用BDB的API来操作,例如自己写一个java程序去访问BDB数据库。
2016-06-12 09:49 回复了该问题