数据挖掘管理系统规范说明 现状简介 强度挖掘(Intension Mining) I-MIN过程模型(Process Model)

Slides:



Advertisements
Similar presentations
手工加工全框眼镜技术 前调整确定加工基准制作模板割边 磨边磨安全角 (抛光) 装配 后调整检测.
Advertisements

湘雅路街道 刘韬 2014 年 4 月 微时代 · 新挑战. 什么是微时代 : 微时代即以微博、微信 等作为传播媒介代表,以短 小精炼作为文化传播特征的 时代。 开福区湘雅路街道工委 微博:微型博客的简称,即一句话 博客,是一种通过关注机制分享简 短实时信息的广播式的社交网络平 台。 微信:是腾讯公司于.
融资融券业务的保证金与保证金比例 光大证券 · 信用业务管理总部 2015 年 12 月 ★融资融券业务投资者教育活动材料★
第三节 排气护理. 一、肠胀气病人的护理 肠胀气是指胃肠道内有过多的气体积聚,不能 排出。 1. 心理护理 2. 适当活动 3. 必要时遵医嘱给药或行肛管排气 4. 健康教育.
道家養生保健長壽藥膳 藥膳應用原則: 天人相應,道法自然 藥膳有兩個職能: 一是保健增壽,一是治療疾病。 ◎ 黃蕙棻.
第二节 脉搏的评估及异 常时的护理. 教学目标  1 、解释有关名词  2 、说出脉搏、呼吸的正常值  3 、叙述脉搏、呼吸的测量方法;识别脉搏、 呼吸的异常变化  4 、叙述测量脉搏、呼吸的注意事项  5 、正确记录脉搏、呼吸,做到认真负责,实 事求是。
台北市立南港高工 建築科 Architecture 建築科之精神:活力、責任、效率 建築科之展望:共築美麗人生 綜合高中 土木建築學程簡介  綜高土建升學進路  未來出路展望  專業證照考試  未來展望圖例  綜高土建學程課程架構  土建群統一入學測驗考科  升學人數統計.
项目四、腻子的施工  一、准备工作  二、安全与卫生  三、板件表面的处理  四、准备腻子  五、刮腻子  六、腻子的干燥  七、腻子的打磨  结束.
体 体 育 育 保 保 健 健 学 学 实 实 验 验 主讲人:王会凤 黄淮学院体育系.
冷 热 疗 法.
~~水世界~~ ——”大视野”活动.
個人理財規劃 第八章 投資規劃.
保育员工作职责.
开天门 梅州市中医医院 郑雪辉.
小儿斜颈的诊断与治疗.
成本管理会计 成本管理会计课程组 2010年3月.
中式面点技艺 长春市商业职业技术学校 王成贵 中式面点技艺 长春市商业职业技术学校 授课教师: 王 成 贵.
消防安全知识讲座 ---校园防火与逃生 保卫科.
天府欧城“星光儿童乐园” ---项目计划书 此为机密文件。 天府欧城.
一寸光阴一寸金 寸金难买寸光阴 时间.
企業政策 組員: 柯凱旗 楊惠雅 徐婷姿 劉家伶 王玟雅.
中国《大数据时代,广告公司业务模式重构》培训会 Big data era, open a new business model
第三章 儿童少年、女子及 中老年的体育卫生 第一节 儿童少年的体育卫生
健康评估 第二章 健康评估方法.
大甲.
学生学业水平诊断与提升策略探究 平阳中学 周秀丽.
台灣電力公司南區施工處 執行統包經驗簡報 陳副處長文欣 報告.
征服火灾是全社会的事业,它需要科技的进步,需要消防监督,也需要消防科学知识的普及和提高。通过各类的消防安全培训,从而使人们更好的掌握消防常识和了解消防法规,提高消防安全意识,提高自防自救能力,使我们的生产和生活远离火灾的侵袭。
足球運動情報蒐集與分析 趙榮瑞 教授.
青春期男生女生交往.
11 物流仿真技术 11.1物流系统仿真 11.2 物流仿真方法 知识归纳 复习题.
講師:賴玉珊 心理師 證照:諮商心理師(諮心字第001495號) 學歷:國立台南大學諮商與輔導研究所 畢 現任:長榮大學諮商中心專任心理師
二、汽化和液化.
复习: 一、细胞膜的成分 1、脂质 2、蛋白质 3、糖类 二、生物膜的功能: 1、界膜 2、控制物质的进出 3、进行细胞间信息交流.
实验一:细菌的革兰氏染色 1.实验器材 菌种:大肠杆菌;金黄色葡萄球菌;链球菌;溶藻弧菌
第九章 国际电子商务法 本章内容:电子商务主体及其权利义务; 两个《示范法》主要内容;电子商务合同;相关知识产权保护。
金属学与热处理 主讲: 杨慧.
工業局推動性別主流化 經濟部工業局 何專門委員紀芳 104年12月2日.
第十八章 药物疗法与过敏试验法 郭三花 岳月梅 忻州职院护理系.
食品日用品流通業電子化報告 全聯實業 與 寶雅國際
舌尖上的邵阳 Business And.
第1节人体内物质的运输 人体的组织细胞每时每刻都需要营养物质和氧,并不断产生二氧化碳、尿素等废物。这些物质在人体内运输主要依靠 系统。人体的血液循环系统由 、 和 组成。 血液循环 血管 心脏 血液.
誰搶走我們的客戶 頂尖保險經紀人 FYB=FYP×代理費.
科學科 污染 空氣 成因 的 : 題目 及 減少空氣污染的方法 陳玉玲 (4) 姓名 : 去到目錄.
第3节 以水为主要传热介质 的烹调方法.
國內發展PACS之回顧與展望 黃興進 彭振興 連俊瑋 國立中正大學資訊管理學系 國立中正大學醫療資訊管理研究中心
第一章 汽车的解体与清洗 第一节 汽车解体工艺 一、零件的拆卸原则 1、拆卸前应熟悉被拆总成的结构
電 子 工 程 系 資料庫系統期末報告 門市人流管理系統 組員: 吳事佳 楊琮琪
十四堂人生創意課 作者 李欣頻 塑造自身生命風格,專心做自己,活出精采的生命.
線上分析處理、 資料採礦與 Analysis Services
金融数据挖掘和商业数据挖掘 建构信用卡评分模型之商业智能流程
Data Mining 資料探勘 Introduction to Data Mining Min-Yuh Day 戴敏育
第十二章 資料探勘、商業智慧、知識管理 第三篇 企業對消費者B2C篇.
第一章 決策支援與企業智慧.
國立豐原高級中學 104學年度家長代表大會 主持人:張健家會長 時間:104年10月3日(星期六)上午10時0分 地點:行政樓二樓會議室.
数据挖掘与医学数据资源开发利用 报告人: 张霞文 2017年03月17日
试乘试驾团购执行方案(模板) 单 位:经销商名称 时 间:
第一单元:分数乘法 分数乘小数 浙江省诸暨市直埠镇第五完小 章麒鹤.
SOA模型设计 杨子 2009/09/30.
主講人:陳鴻文 副教授 銘傳大學資訊傳播工程系所 日期:3/13/2010
評分標準.
实验八 石蜡切片法.
IEEM 5352 Enterprise Integration
中国农业科学院博士后学术论坛 博士后基金申请的经验及体会 中国农业科学院生物技术研究所 秦 华 博士
北师大版 五年级上册 第五单元 分数的意义 拓展 问题 探究 练习.
综述周攀·王开正审校 海南大学 数据挖掘的研究进展及在临床医学中的应用 指导教师:齐琦 报告人:王子尧 信息科学技术学院
企業導入客戶關係管理(CRM) 建置需求與期望
软件开发理念 法会通知 点灯邀请与通知函 请柬与生日祝福 该年度犯太岁生肖信众与点灯通知 添油香与点灯拜斗纪录 与信众保持良好的互动关系…
看月亮 作者:计禾.
知識管理 資管四德 S 蘇恆群.
Presentation transcript:

数据挖掘管理系统规范说明 现状简介 强度挖掘(Intension Mining) I-MIN过程模型(Process Model) I-MIN系统的功能组件(Functional Components) 强度挖掘算子(Operators) I-MIN系统的三层体系结构(Architecture) 小结

Business Understanding 现状简介 传统的KDD过程模型(CRISP-DM模型) Business Understanding Data Understanding Data Preparation Data Exploration Data Mining Evaluation Deployment

现状简介 当前的数据挖掘系统和数据挖掘工具包要求使用者必须是数据挖掘专家 非专业用户需要与数据挖掘专家密切配合才能保证获得理想的数据挖掘结果 用户使用极为不方便

强度挖掘(Intension Mining) 挖掘目标以知识发现模式(Knowledge Discovery Schema)的形式存储 强度挖掘模式包含了一般挖掘需求(Generic mining requirements)的规格说明 强度挖掘是基于增量式挖掘概念的,增量数据库按固定的时间间隔进行自动处理 处理过程由数据预挖掘组成,主要包括初步分析和聚集(Aggregation) 强度挖掘主要由计划阶段(Planning phase),累积阶段(Accumulation phase)和挖掘阶段(Mining phase)三个阶段组成

强度挖掘(Intension Mining) 计划阶段 知识发现模式(Knowledge Discovery Schema, KDS)的创建 编译知识发现模式得到对应的元数据和数据结构

强度挖掘(Intension Mining) 累积阶段 通过元数据对增量数据库进行预挖掘,得到浓缩知识(Knowledge Concentrate, KC) 浓缩知识作为最终知识的中间表示形式,以浓缩知识窗口的形式为进一步的数据挖掘服务

强度挖掘(Intension Mining) 挖掘阶段 用户提交数据挖掘查询或执行数据挖掘应用程序 挖掘算法对浓缩知识进行处理,得到用户最终所需的知识

强度挖掘(Intension Mining) 重要特征 将KDD看作一个连续的过程,以固定的时间间隔对增量数据库进行周期性累积产生浓缩知识 浓缩知识窗口是知识更新和知识共享的基础

I-MIN过程模型(Process Model) 基于强度挖掘概念的以用户为中心的KDD过程模型 支持对KDD过程的交互式探索和试验 向下兼容传统的KDD过程模型 处理步骤分别标记为IM1, IM2, ……, IM6

I-MIN过程模型(Process Model)

I-MIN过程模型(Process Model) 对应于强度挖掘中的计划阶段 确定挖掘目标 以知识发现模式的形式表示挖掘目标 编译知识发现模式得到元数据

I-MIN过程模型(Process Model) 对应于积累阶段 是一个复合过程 IM2a, IM2b, IM2c分别对应于传统KDD过程的数据选择、数据清洗和数据转换 IM2d负责对预挖掘数据进行分析和聚集 不需人工干预而以固定的时间间隔自动执行 输出浓缩知识(KC)

I-MIN过程模型(Process Model) 标志着挖掘阶段的开始 用户提交挖掘查询或自己开发的应用程序 在IM2中得到的浓缩知识在本步骤可以共享

I-MIN过程模型(Process Model) 真正的数据挖掘步骤 知识发现模式中指定的数据挖掘算法被激活 用户期望的知识是从浓缩知识中挖掘出来

I-MIN过程模型(Process Model)

I-MIN系统的功能组件 实现I-MIN模型需要为累积、挖掘、试验和跟踪开发相应的组件 不同类型的知识对应的组件是不同的

I-MIN系统的功能组件

I-MIN系统的功能组件 实现I-MIN模型需要5种组件: K为使用算法A发现的知识类型 TM为合并算子,用于指定数据库子集 <TM(KA), FaccTM(KA), FminTM(KA), FexpTM(KA), FmonTM(KA)> K为使用算法A发现的知识类型 TM为合并算子,用于指定数据库子集 FaccTM为累积组件 FminTM为挖掘组件 FexpTM为试验组件 FmonTM为跟踪组件

I-MIN系统的功能组件 累积组件 对数据进行初步分析和局部聚集,实现IM2d 由系统自动激活 为增量数据库构建浓缩知识窗口 对最终用户而言是透明的

I-MIN系统的功能组件 合并组件 用户可以动态指定挖掘的数据目标子集 通过指定需要的时间间隔来达到合并的目的 固定周期内的浓缩知识需要合并产生一个合并的大窗口

I-MIN系统的功能组件 挖掘组件 由实际的挖掘算法组成 用户提交挖掘查询或应用程序时激活 一个算法根据参数的不同可能对应多个功能

I-MIN系统的功能组件 试验组件 支持以用户为中心的数据探索和试验 通过不同的常数、数据子集和参数进行重复的试验 通过用户应用程序的方式设计新的试验满足特别的挖掘需求

I-MIN系统的功能组件 跟踪组件 比较不同窗口中发现的知识来达到对数据特征进行审查的目的 可以有效发现模式的变化过程

I-MIN系统的功能组件 最后两个组件可以有效体现以用户为中心的本质 如果忽略TM、Fexp,和Fmon,I-MIN模型就还原为传统的KDD过程模型

强度挖掘算子(Operators) 用户通过算子以强度挖掘查询语言或API的方式访问功能组件对应的功能 算子可以分为: 基本算子 累积算子(用户透明) 合并算子(用户透明) 挖掘算子 二级算子 探索和比较多个数据子集 知识的存储和检索 关联规则的基本算子和二级算子已经开发出来

I-MIN系统的三层体系结构 对整个KDD过程进行抽象,并为知识管理提供有效的环境 独立于数据库系统和相应平台,支持知识发现,知识保存,知识更新和知识共享 层次结构包括前后端层、核心层和存储模式层 每层都有一个引擎,用于维护该层的数据库,协调层内不同组件之间的通信 元数据队在三层之间是共享的 数据交换接口提供了访问数据源的机制

I-MIN系统的三层体系结构

I-MIN系统的三层体系结构 知识抽象 存储模式层描述稠密知识单元如何通过数据结构和文件进行保存,对知识提供最低层次的抽象 中间层的知识发现模式将稠密知识单元抽象为浓缩知识或窗口 使用浓缩知识的应用程序对知识提供最高层次的抽象 修改浓缩知识的物理数据结构而对映射关系和应用程序没有影响的能力称为数据的物理独立性

I-MIN系统的三层体系结构 KDD过程抽象 预挖掘和聚集,存储结构和浓缩知识的映射关系等具体细节对最终用户而言是看不见的 用户的KDD过程由知识发现模式定义的一般KDD过程得到 对最终用户而言,提交一条挖掘查询或应用程序就定义了用户自己的KDD过程 通过改变预挖掘功能或挖掘算法修改KDD过程而不影响应用程序的能力称为数据的逻辑独立性

I-MIN系统的三层体系结构 前后端层 提供了I-MIN系统的用户接口 主要包括如下组件 强度挖掘查询处理器 知识发现模式编译器 表示管理器 组件管理器 库管理器 数据接口交换管理器

I-MIN系统的三层体系结构 核心层 数据挖掘引擎 激活累积组件 对用户查询和应用程序进行响应 与数据交换接口通信,从目标数据库中检索所需数据 功能模块有五个功能组件组成 预挖掘功能库用于数据选择、数据清洗和数据转换

I-MIN系统的三层体系结构 存储模式层 支持浓缩知识的存储 支持浓缩知识的合并和检索 为用户应用程序提供数据的物理独立性

I-MIN系统的三层体系结构 元数据和数据交换接口 元数据用于知识发现、知识重用和知识共享 数据交换接口用于实现KDD过程相对于数据源的独立性

小结 提出了针对KDD过程的以用户为中心的模型 提出基于该模型的数据挖掘管理系统体系结构 系统提供的操作算子用于开发数据挖掘应用程序 本体系结构独立于平台和领域 以用户为中心的方式进行知识发现、知识保存、知识更新和知识共享

谢谢!