Download presentation
Presentation is loading. Please wait.
1
数据仓库与数据挖掘实验
2
实验一 Weka软件安装、配置 实验目的: 熟悉WEKA软件的安装,配置,了解arff文件的格式。 实验内容: 1软件安装
Weka的官方地址是 os,linux等平台下的版本,我们以windows系统作为示例。 2数据格式说明 Weka支持很多种文件格式,包括arff、xrff、csv,甚至有libsvm的格式。其中,arff是最常用的格式。
3
实验二 Weka数据管理 实验目的: 软件工作界面介绍和学习使用WEKA软件进行数据的预处理。 实验内容: 1.WEKA工作界面介绍
2. 数据预处理过程
4
实验三 关联规则算法实现 实验目的: 使用weka软件运行apriori算法,了解参数意义。 实验内容: 1数据集说明
3.分析关联结果
5
实验四 决策树分类实现 实验目的: 使用weka软件运行决策树分类算法。 实验内容: 1数据集说明 2.在WEKA下运行决策树分类算法过程 3.分析分类结果 4理解10折交叉验证
6
实验五分类算法—朴素贝叶斯和k-最近邻分类算法
实验目的: 1熟悉WEKA软件中几种重要分类算法的使用方法; 2使用weka软件运行分类算法中的朴素贝叶斯和k-最近邻算法,和实验四中的决策树C4.5算法进行比较,对三种算法进行评价比较。 实验内容: 1数据集说明 2.在WEKA下运行分类算法过程 3.对三种算法(即C4.5,朴素贝叶斯,k-最近邻)的运行 结果进行比较。
7
实验六 聚类K-means算法 实验目的: 使用weka软件中提供的simpleKeans方法对数据做聚类分析,更深刻的理解k-均值算法。
实验内容: 1.数据集说明 2.在WEKA下运行k-means算法过程
8
实验七 综合性实验 数据分析综合实验 实验目的: 1熟练掌握常用数据挖掘算法原理 2全面分析实际问题,构造解决思路 实验内容: 理解分析股市交易历史行情 实验过程: 1.整理数据 2.数据重构 3.运行算法,分析结果
9
实验八 设计性实验 神经网络分类实现 利用神经网络分类方法实现对促销产品的选型 思路:根据以往促销活动的历史数据,字段大致如下:产品ID、品种、成本、推广促销费用、促销前销售额和促销后销售额,建立神经网络模型预测目前产品的促销效果。
Similar presentations