SmartMining

数据挖掘、商业智能、大数据从业者:相关产品设计、项目管理、咨询、培训

始于: 2015-11-08

发私信

1429

总声望

102

次被推荐

41

粉丝

他的回答
排序:

1
投票

有中文自然语言处理推荐吗

SmartMining数据挖掘软件的中文分词是可以的,有专门的文本挖掘模块,也很好用,你试一下。

2017-04-16 11:06 回复了该问题
1
投票

spss测量软件在用计算产量求平均值时跳出变量名不正确 这是为什么啊?

spss有bug,你重新读取数据源就可以了。

2016-03-29 19:34 回复了该问题
0
投票

请教个问题 做数据挖掘的时候 数据放到数据集市 数据集市的建模 是不是要和 挖掘程序相关

您好!建设挖掘所需的数据集市有两种情况: 第一,在模型训练阶段,需要把挖掘建模所需要的数据提供到集市中,此时集市中的数据只要是做挖掘的所需的数据就可以了,和挖掘...

2016-03-29 10:57 回复了该问题
1
投票

我们是医疗行业的,病人的病例等信息属于敏感信息,想问下脱敏处理是怎么做的? 【来源:3月5日北京线下沙龙Smartbi互动提问】

这个使用编码的方式处理。即为病例等信息设置编码值,这样可以让别人看到的都是数字,看不出什么意思。这个是可以使用SmartMining的重新编码节点实现。

2016-03-10 19:26 回复了该问题
1
投票

我们的团队在30人以下,想做一些大数据方面的应用,如果使用您这个产品,费用大概要多少? 【来源:3月5日北京线下沙龙Smartbi互动提问】

您应该是给自己公司做吧。这个主要看数据量,如果一张表最多只有百万条的数据量,可以使用我们的免费版,不用任何费用。如果有几千万条记录,桌面版就可以搞定。那么十几万...

2016-03-10 19:23 回复了该问题
2
投票

私有云和公有云有什么区别?各有哪些优缺点,目前企业在具体使用时该怎么选择? 【来源:3月5日北京线下沙龙Smartbi互动提问】

两者区别主要在于建设成本和安全性上。 私有云更安全,因为建设在企业内部的局域网内,不会把数据放到别人的平台上,企业自己更可控更安全。但是相对建设成本比公有云高一...

2016-03-10 19:17 回复了该问题
0
投票

现在医疗行业正在做医疗病例电子化,去中心化,现在很多数据要去社区医院、药厂等系统去提取,像这种多系统协同,敏感信息的屏蔽等该怎么做?【来源:3月5日北京线下沙龙好自由提问】

针对这个问题,最好的办法是改变数据获取方式。原来是要把所需数据都提前抽取过来,这样用得到的和用不到的都抽取过来了。这样必然会把患者信息泄漏给竞争对手。因此要想防...

2016-03-10 19:09 回复了该问题
4
投票

现在有大数据、精准挖掘、人工智能等这么多概念及技术,它们之间的关系以及企业大数据实施的路线图应该是怎样的? 【来源:3月5日北京线下沙龙好自由提问】

       大数据、数据挖掘、人工智能三者的关系可以简单的理解为:大数据是原材料,数据挖掘是加工厂,而人工智能是数据产品尤其是基于数据挖掘技术建立的专家系统的...

2016-03-10 19:01 回复了该问题
2
投票

求大神指点:对于相同数据,利用二项probit模型的优度比二项logit模型优度要好,可不可以说是因为数据相对服从正态分布导致的两种模型的优劣?

     logistic回归的因变量可以是二分类的,也可以是多分类的,但是二分类的更为常用,也更加容易解释。所以实际中最为常用的就是二分类的logistic回...

2016-03-10 17:52 回复了该问题
2
投票

请教大家个问题,我这有个应用场景,做学生与就业信息的推荐,我的思路是如下描述

您好!这个思路没有问题。也正如您所说的第五步至关重要。而第三步和第四步的核心就是对学生进行画像,建设学生完善的标签库。这个是推荐的基础和学生基本信息保证。在学生...

2016-01-07 11:32 回复了该问题
1
投票

请教大神,很想问一下:传统通过多维建模以后进行各个维度进行种分析,与现在流行的“数据挖掘”的概念有什么不同?

其实,可以简单的理解,多维分析是数据的多维度视图,是数据的一种探索分析手段,和图形化可视化探索数据异曲同工,你可以把多维分析作为数据挖掘可视化探索的一部分。而数...

2016-01-07 11:18 回复了该问题
1
投票

spss modeler支持中文的文本挖掘吗?效果如何?

暂且不支持中分分词。

2015-12-10 17:42 回复了该问题
1
投票

java 数据挖掘,算法 环境搭建及工具包推荐

给您两种选择方案,一个是开源的,使用hadoop的框架,借助其mapreduce分布式计算框架进行分布式挖掘,它都是基于java实现的,可以解决TB级以上的数据...

2015-12-06 09:31 回复了该问题
1
投票

有人熟悉线性回归之类的算法分析工具吗 ,求帮忙介绍下,谢谢

请使用这个工具,这个是最易用的挖掘工具 下载地址:[url]http://pan.baidu.com/s/1o6B0GdW[/url] 学习资料:[url]ht...

2015-12-02 18:36 回复了该问题
2
投票

深度学习为何在图像识别和语音识别领域效果较好,而在文本语义匹配计算上相比传统方法没有突破?

这个不是技术问题,而是研究条件的问题。像用于深度学习研究的语音或者图像都很好找,但是用于深度学习研究的文本语义可就不好造了,这个只能根据用户打字习惯进行学习,具...

2015-11-25 23:29 回复了该问题

改版

反馈