平常心

大数据工程师

始于: 2015-06-18

广东省 深圳市

发私信

704

总声望

64

次被推荐

63

粉丝

他的回答
排序:

2
投票

求一条学习大数据的科学路线?

1.想知道楼主是学生吗?如果是研究生,我所知道的他们的课题就已经接触了svm等算法; 2.如果是在职的话,自己的建议就是找家公司,进入数据部门,所有的一切你都...

2015-09-06 11:37 回复了该问题
1
投票

请问下 公司做BI,已经把数据提取到hadoop里面的hive里面了 现在有没有软件能够实现对应的前端展现?

1.自己接触的birt中可以使用hive 2.基于hadoop的olap应用有kylin

2015-09-06 11:29 回复了该问题
1
投票

请问hive的map字段可以修改某个key的value值吗?

0.13之前hive是不提供update语法的,可以百度一下怎么样设置hive支持update操作  

2015-09-06 11:24 回复了该问题
3
投票

kettle里用js调用java类的方法有哪些?

1.编写java类并打成jar包放到kettle的lib下面 2.在转换的javascript代码中调用,如下图:  [attach]5396[/attac...

2015-08-28 15:15 回复了该问题
1
投票

求大神们 指点迷津 Kettle是否可以根据表名:table_yesterday的内容,定时创建一个表名:new_table_YYYYMMDD的副本 谢谢 谢谢了

kettle不能自动创建表,要手动创建表,比如src_tab,先创建src_tab_yyyy,然后使用表输出直接到src_tab_yyy或者是表输出的分区选择进...

2015-08-28 12:21 回复了该问题
4
投票

各位达人 kettle 抽取大表的时候 有什么优化策略吗?

1.是要增量抽取还是全量,如果全量直接走数据库dump,然后ftp就可以了,只适用于数据初始化; 2.缓存设置,如Rowset,是两个步骤之间的缓存,可以调大数...

2015-08-28 12:15 回复了该问题
2
投票

请问我要用Java动态控制输出和更新插入的表和字段该怎么办?

1.转换设置命名参数对应你的表,字段输出2.查看api, TransExecutionConfiguration execConfig = new TransE...

2015-08-14 10:13 回复了该问题

改版

反馈