Download presentation
Presentation is loading. Please wait.
1
数据挖掘工具性能比较
2
主要数据挖掘工具 SAS公司的 Enterprise Miner IBM公司的 Intelligent Miner
SPSS公司的 Clementine Statsoft公司的Statistica Data Miner DB Miner公司的 DBMiner NCR公司的Teradata Warehouse Miner Unica公司的Affinium Model Insightful公司的Insightful Miner Data Miner 公司的RIK, EDM and DMSK Information Discovery 公司的Data Mining Suite Angoss 公司的 KnowledgeSTUDIO Data Mining Technologies 公司的 Nuggets Fujitsu公司的 GhostMiner Oracle公司的 Darwin
3
数据挖掘工具选择指导原则 公司的数据挖掘需求是短期行为还是长期使用 公司的数据挖掘经验和水平 公司的数据状态 公司的预算 工具的性能
4
工具评判-数据存取 功能和特征 数据存取 带权得分 软件 IBM SAS 特征 Intelligent Enterprise SPSS 权值
软件 IBM SAS 特征 Intelligent Enterprise SPSS 权值 Miner Clementine 文本文件 30% 30 EXCEL文件 10% 5 10 通过数据库的NATIVE接口取得数据 20 25 ODBC/JDBC/OLEDB 总分 100% 75 90 80
5
工具评判-数据处理 功能和特征 数据处理 带权得分 软件 IBM SAS 特征 Intelligent Enterprise SPSS 权值
功能和特征 数据处理 带权得分 软件 IBM SAS 特征 Intelligent Enterprise SPSS 权值 Miner Clementine 基本数学变化 20% 18 20 数据分段 5% 5 数据整合 10% 10 数据过滤 数据转换 数据编码 数据随机采样 15 SQL支持 15% 总分 10.00% 93 100 98
6
工具评判-模型算法 功能和特征 模型算法 带权得分 软件 IBM SAS 特征 Intelligent Enterprise SPSS 权值
功能和特征 模型算法 带权得分 软件 IBM SAS 特征 Intelligent Enterprise SPSS 权值 Miner Clementine 聚类 20% 20 16 分类 18 统计 10% 8 10 关联分析 15% 15 相关分析 时间序列 5% 4 5 值预测 总分 100% 91 96
7
工具评判-自动建模 功能和特征 自动建模 带权得分 软件 IBM SAS 特征 Intelligent Enterprise SPSS 权值
自动建模 带权得分 软件 IBM SAS 特征 Intelligent Enterprise SPSS 权值 Miner Clementine 模型并行性 30% 30 25 模型优化 20% 18 20 模型间结果共享 10% 9 10 8 参数设置灵活性 40% 35 40 总分 100% 92 100 86
8
工具评判-可视化技术 功能和特征 可视化技术 带权得分 软件 IBM SAS SPSS Clementine 特征 Intelligent
软件 IBM SAS SPSS Clementine 特征 Intelligent Enterprise 权值 Miner 2-D 图 15% 15 12 3-D 图 10% 5 8 树状显示 10 散点图 线图 饼图 ROC 图 Gain Lift 图 20% 20 总分 100% 88 95 91
9
工具评判-其它 功能和特征 其它 带权得分 软件 IBM SAS 特征权值 Intelligent Enterprise SPSS
软件 IBM SAS 特征权值 Intelligent Enterprise SPSS Miner Clementine 中文支持 30% 30 过度训练解决 15% 8 12 10 平台通用性 20% 18 20 模型代码输出 用户友好界面 16 总分 100% 78 92 56
10
工具评判-总分 功能 总分 软件 IBM SAS Intelligent Enterprise SPSS 权值 Miner
软件 IBM SAS Intelligent Enterprise SPSS 权值 Miner Clementine 数据存取 10% 75 90 80 数据处理 20% 93 100 98 模型算法 30% 91 96 自动建模 92 86 可视化 15% 88 95 其它 78 56 100%
Similar presentations