个人的一点建议供楼主参考: 首先理解下楼主的描述,楼主希望将新增的N条数据归入已经聚好的M个类中,这里面的关键前提是已有的类信息不会发生变化,只是按已有的类信...
2016-04-29 10:59 回复了该问题个人的一点建议,供参考: 1 就分析目标而言,你的描述只是对一组数据尽可的分析,而没有把分析过程和某一应用目标相联系,所以这里的分析只能理解为数据本身进行一些...
2016-03-07 14:47 回复了该问题目前支持聚类分析的工具比较多,不过在考虑具体使用什么工具之前建议楼主先考虑几个问题: 1 这里的数据准备好具体是一个什么情况? 数据是什么类型? ...
2016-03-25 00:36 回复了该问题一点小建议: 1 进行数据分析挖掘最好有一个具体的应用分析目标,在没有应用分析目标的情况下单纯为分而分很多情况下得到的结果的针对性会比较差。 2 确定一个应用分...
2016-03-21 13:27 回复了该问题个人感觉这个问题的需要明确几个细节才能考虑如何实现: 1 你说的自动化变量筛选是指建模前的数据预处理过程? 2 一般情况下这种类型的建模要涉及训练,评估,应用三...
2016-03-07 16:27 回复了该问题楼主的这个问题感觉范围比较广,个人的一点看法如下: 1 就决策树的这个算法而言,在非常多的行业都会有应用,是不是使用决策树进行挖掘分析个人认为还是要看具体的应用...
2016-03-08 10:32 回复了该问题顶二楼!小补两句: 1 楼主可以考虑参照一下之前几年的预算报告,之前预算报告对预算结果有影响的关键点的可能会对你制订预算具有参照作用,同时可以考虑使用之前预算报...
2016-03-25 01:21 回复了该问题一点建议,请参考: 1 网络爬虫属于搜索引擎的技术范畴,属于搜索引擎采集数据的关键手段,是下一步根据采集内容建立摘要和索引的基础,说白点就是模拟浏览器对URL的...
2016-03-21 11:13 回复了该问题楼主这个问题涉及的方面比较多,我简单说两句,供参考: 1 分类和回归本质上都是通过对已有数据的训练结果形成决策知识为预测型的应用目标服务的。 2 回归往往面对的...
2016-03-21 12:41 回复了该问题这个问题建议楼主可以这样考虑: 1 简单来说数据集市的产生要以数据仓库作为基础,建立数据仓库的目的是提供面向主题的、集成稳定的、随时间不断变化的数据集合,数据仓...
2016-03-29 23:26 回复了该问题建议: 1 使用的算法工具有中间结果的输出?如果有的话可以考虑将两次处理过程的中间结果分别输出进行对比。 2 如果1工具不支持的话此神经元算法是否可以拆分成多个...
2016-03-08 10:29 回复了该问题可以考虑两个选择。 1 将excel文件转换成CSV文件进行处理。 2 升级datastage的版本,新版本里有直接对excel文件进行处理的stage。
2016-03-08 11:33 回复了该问题回答之前需要楼主明确两个小问题: 1 按你问题的理解:这里的直接数据挖掘你想表达的是什么含义?那对应的非直接或间接数据挖掘你是如何理解的。 2 数据挖掘技术的核...
2016-04-25 12:50 回复了该问题说个类比的例子,供楼主参考: 比如你想吃一道菜剁椒鱼头,可能存在如下三种情况: 1)你不知道这道菜需要什么原材料,你选择直接去饭店的...
2016-04-25 13:26 回复了该问题