天善智能-商业智能和大数据在线社区，用心创造价值

0

投票

初涉storm 请教各位一个问题 storm停止命令是什么？比如怎么停nimbus supervisor

storm kill topology-name 如果想在每个节点都停止某个服务： sudo service supervisord stop

2016-06-28 13:05 回复了该问题

0

投票

知道org.apache.hadoop.hbase.filter.WritableByteArrayComparable 是hbase 哪个包下的吗？

这个文件应该是在hbase 0.9*的jar中，例如0.92,0.94。新的版本暂时未发现

2016-06-27 17:38 回复了该问题

0

投票

请教一个问题跑Hadoop 依赖 xinetd 嘛？

hadoop里面的分布式文件系统依赖很多Linux的基础服务。其中就会用到rsync 而rsync是依赖 xinetd服务的。默认情况下，Linux(cent...

2016-06-27 17:15 回复了该问题

0

投票

hbase数据库有没有一些靠谱的可视化界面工具？

可以看看外面有没有基于 phoenix 写的可视化工具 hue 也可以连接到hbase

2016-06-24 17:10 回复了该问题

0

投票

spark sql 能建索引吗？

可以试试DataFrame + dfZipWithIndex的组合方式。看看能不能提升些性能

2016-06-14 13:56 回复了该问题

1

投票

请教大家个问题 kettle在实时抽取方面咋样数据量10T MySQL到hive

你的数据量有10T，应该不是实时抽取。如果数据量比较大，建议使用增量模式，并且数据同步工具改用sqoop来进行。

2016-06-12 11:09 回复了该问题

0

投票

mapreduce将wordcount结果写入hbase，但是和hdfs中的raw不一致，什么情况？

因为hbase的底层是hfile，是二进制存储，与文件系统hdfs还是有不一样的

2016-06-12 11:06 回复了该问题

0

投票

求赐简单的excel里链接图片的VBA代码

Image1.Picture = LoadPicture("图片地址.jpg")

2016-06-12 11:02 回复了该问题

0

投票

请教给位大神一个问题，hbase如何做权限管理啊？看到一些对用户赋权限的帖子，但是却找不到相关创建用户的例子

hbase权限管理的配置： <property> <name>hbase.superuser</name> ...

2016-06-12 10:10 回复了该问题

0

投票

如何实现hive分组抽样返回数据？

在hive中有row_number()函数，例如 row_number( order by uuid() ) uuid函数：select reflect(“ja...

2016-06-12 10:04 回复了该问题

0

投票

Hadoop、spark分析excel文件有什么建议经验分享？

建议数据先在hadoop进行预处理，生成文本内容后再使用spark或hive进行后续的处理在使用hadoop进行excel操作时，可能需要自定义input...

2016-06-12 09:56 回复了该问题

0

投票

在一台没装hadoop的机器的文件，怎么传到hdfs里。有哪些大神指导下

使用shell进行免密码访问

2016-06-12 09:54 回复了该问题

0

投票

客户端要上传视频到hdfs，是以什么方式上传比较好？hdfs要怎么设置效率比较高？

最好是离线方式吧，例如ftp的方式。 hdfs方面的设置则要考虑数据块的大小、hdfs客户端超时时间等

2016-06-12 09:52 回复了该问题

0

投票

基于hadoop平台的数据质量管理

我这边的做法是自行开发元数据管理和数据监控程序。在这个方面，市面还是比较少的，即使有也不够灵活，所以还是需要自行开发为好

2016-06-12 09:51 回复了该问题

0

投票

请教一下各位大神，有没有谁做过BerkeleyDB数据导入到Hadoop平台的事，是怎么实现的？

建议你用BDB的API来操作，例如自己写一个java程序去访问BDB数据库。

2016-06-12 09:49 回复了该问题

Bob

他关注的

他的粉丝

他的回答
排序:
时间 投票