数据挖掘与医学数据资源开发利用 报告人: 张霞文 2017年03月17日

Slides:



Advertisements
Similar presentations
学院 : 环境与土木建筑学院 专业 : 旅游管理. PPT 模板下载: 行业 PPT 模板: 节日 PPT 模板: PPT 素材下载: PPT.
Advertisements

PPT 模板下载: 行业 PPT 模板: 节日 PPT 模板: PPT 素材下载: PPT 背景图片:
高温天气 防止中暑 六月 专题讲 座. 中暑出 现 体温升高并昏迷 时 死亡率高达 60%~70% 2015 年七月福建福州 , 气温居高不下一名建筑工人因 为长时 间 在烈日下干活 , 不幸中暑死亡 。 2015 年 7 月 武 汉 迎来高温酷暑天气 , 14 人中暑死亡 。 2015.
PPT 模板下载: 行业 PPT 模板: 节日 PPT 模板: PPT 素材下载: PPT 背景图片:
学位申请人:胡生娜 专业:会计学 研究方向:审计理论与方法 指导老师:王琳 教授 莲花味精审计 PPT 模板下载: 行业 PPT 模板: 节日 PPT 模板: PPT 素材下载:
胸 痹 — 寒湿痹阻 演讲:白雪 讲稿:段钰 贾秋瑾 资料:柴红 PPT :张翎 李萌 PPT 模板下载: 行业 PPT 模板: 节日 PPT 模板: PPT 素材下载:
乳腺结核诊治 PPT背景图片: PPT图表下载:
104年文教事業經營研究所 認識十二年國民基本教育 教育部國民及學前教育署副署長 王承先.
小豬變形記.
甘肃电保姆电力工程服务有限公司 用电有问题 快找电保姆 董春雷
团队建设与友谊之桥 陈娬,教授,华南师范大学
经典H1受体拮抗剂:丙胺类 氯苯那敏 Chlorphenamine 小组成员: 景一贤、蓝江儿、妥艳艳、汪洋、袁聪敏、杨崟倩、郑晓婷 1
小壁虎借尾巴 第一PPT模板网-
资料下载: PPT课件下载:
渔夫的故事 第一PPT模板网-
“规划进校园”系列志愿活动 北京市城市规划设计研究院 交通所
蚂蚁小队 - 倾 情 出 品 –.
图书馆 学科信息服务内容简介.
为什么会有蛀牙 PPT背景图片: PPT图表下载:
我 長 大 以 後.
快乐儿童节 Happy Children`s Day
播种阅读 收获明天 ——临沂市图书馆阅读推广活动案例 点击添加文本 点击添加文本 点击添加文本 点击添加文本.
践行物联网 ● 推动民爆行业“互联网+” 创新 · 合作 · 共赢.
生活中的百分数 荻港中心小学 章春莲.
安全生产法 PPT背景图片: PPT图表下载:
巧补妙写展才情 说 考点 2016年高考补写题专题复习 说考情 说课课件 湖北省黄梅一中 说学情 邓美玲 说复习方案.
华宸未来·上海意邦专项资产管理计划.
JU53商学院 第二堂课程《淘宝运营之店铺基础操作》.
中国经济增长的低效率冲击与减速治理 张 平 中国社会科学院经济研究所
走一步,再走一步 第一PPT模板网-
双流县教师资格定期注册 操 作 培 训 双流县人才中心教育分中心 联系电话: 双流县教师资格注册群号 :
个人简历 姓 名:胡亚梅 性 别:女 出生年月: 政治面貌:党员 学 历:大学专课 专 业:计算机应用
玲玲的画 第一PPT模板网-
资料下载: PPT课件下载:
專案整合管理 課程報告 報告者:吳東龍 班級:碩資管二甲 學號:MA 課程:南台資管所 專案管理專題 授課老師:陳炳文
资料下载: PPT课件下载:
2015 国培 寿县体育班 班级简报 第6期.
办公软件的应用 吉林省小额再贷款股份有限公司 硬件管理 曹宇星.
岳阳楼记 范仲淹.
有限元在口腔医学中的应用 李薇
范文下载: 试卷下载: Word教程: Excel教程: 优秀PPT下载: PPT教程: 节日PPT模板: PPT素材下载:
绿色——我们永恒的追求 环境保护|能源|绿色城市|生态环境 ———重庆市两江育才中学校.
Free Halloween PowerPoint Template
如何学好历史与社会·思想品德 南海实验初中 邵永福
自我介绍PowerPoint 适用于竞聘,会议及相关类别的幻灯片制作
有理数减法 第一PPT模板网-
媒体融合 温都全媒体发展思路与营销策略 温州都市报 郭乐天
哈利波特的魔法书PPT模板 最新原创PPT模板网-
中医药与健康 9.上工治未病 遂昌育才小学 蓝建云.
大陸勞動合同法實務及勞動爭議處理 2015年03月26日 主講人:洪紹書律師 PINHOU
移动互联网PPT模板网.
104學年度 三峽國小教師專業貢獻平台 社群運作成果報告
概念简约紫色背景PPT模板 PPT宝藏模板网,
RFID於醫療產業之應用 工管四甲/洪健耀/4A152901
写书法的六大好处 制作人:赵文宣 班 级:七(1) 指导老师:胡长青.
期权价格的理解.
POWERPOINT TEMPLATE PRESENTED OfficePLUS BY
企事业述职报告PPT.
自我介绍PowerPoint 适用于竞聘,会议及相关类别的幻灯片制作
圆的面积 漯河经济开发区小学:吴丹.
CONTENTS TEXT 节日PPT模板: PPT素材下载:
范文下载: 试卷下载: Word教程: Excel教程: 优秀PPT下载: PPT教程: 节日PPT模板: PPT素材下载:
LOREM IPSUM DOLOR SIT AMET CONSECTETUER
五四运动和中国共产党的成立.
国庆节/建党节PPT模板 节日PPT模板: PPT素材下载:
“中方课程质量标准——评价标准”. “中方课程质量标准——评价标准” 壹 贰 叁 高中历史 经济危机 不同身份、采访 对历史事件存疑 资料下载: PPT课件下载: 范文下载:
PPT模板 圣诞节快乐 POWERPOINT Word联盟幻灯片 ppt.wordlm.com.
Simple , Powerful and fee
柠檬片幻灯片模板 最新原创PPT模板素材网—
范文下载: 试卷下载: Word教程: Excel教程: 优秀PPT下载: PPT教程: 节日PPT模板: PPT素材下载:
Presentation transcript:

数据挖掘与医学数据资源开发利用 报告人: 张霞文 2017年03月17日 资料下载:www.1ppt.com/ziliao/ PPT课件下载:www.1ppt.com/kejian/ 范文下载:www.1ppt.com/fanwen/ 试卷下载:www.1ppt.com/shiti/ Word教程: www.1ppt.com/word/ Excel教程:www.1ppt.com/excel/ 优秀PPT下载:www.1ppt.com/xiazai/ PPT教程: www.1ppt.com/powerpoint/ 节日PPT模板:www.1ppt.com/jieri/ PPT素材下载:www.1ppt.com/sucai/ PPT背景图片:www.1ppt.com/beijing/ PPT图表下载:www.1ppt.com/tubiao/ PPT模板下载:www.1ppt.com/moban/ 行业PPT模板:www.1ppt.com/hangye/ 教案下载:www.1ppt.com/jiaoan/ 数据挖掘与医学数据资源开发利用 报告人: 张霞文 2017年03月17日

医学数据首先是以疾病诊疗为目的而积累的,其次才是用于医学研究的资源。 医学数据资料的状况 医学数据首先是以疾病诊疗为目的而积累的,其次才是用于医学研究的资源。 医学领域数据来源: 医学影像 实验数据 医生与病人的交流

医学数据资料的状况 医学数据的形式: 纯数据(如体征参数、化验结果等); 影像(如B超、CT等医学成像设备); 信号(如肌电信号、脑电信号等); 文字(如病人的身份记录、症状描述、检测和诊断结果的文字表述等)。

医学数据资料的状况 随着计算机技术的发展,医学数据都逐步采用 数字化。现在电子医学数据库包括电子病历、医学 影像、病理参数、化验结果等。 因此,目前医院里面的医疗数据资料,主要集中在以下几种电子信息库里面: 医院管理信息系统(hospital information system,HIS); 电子病历(electronic medical record,EMR); 实验室系统(laborary information system,LIS); 影像系统(picture archiving and communication systems,PACS); 逐步实施的社区居民健康档案。

医学数据资料的状况 由此可见,有了计算机的帮助,医学数据可以 得到集中的储存。这样大大优于以前的纸质文件, 易于保管、提取以及进一步的科学研究。 但是对于这些数据的提取,因为数据的复杂性, 变得很困难,造成了数据丰富但是知识匮乏的现象 。 因此,在医学数据中加入挖掘理论,可以从缺 乏先验信息的海量数据中提取隐含的、有价值的、 有意义的信息,用以预测未来的趋势以及行为,作 出前瞻性的知识决策。

数据挖掘的应用 数据挖掘(data mining)的概念一般定义为:从数据库的大量数据中揭示隐含的、先进而未知的,潜在有用信息的频繁过程。就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的人们事先不知道但又是潜在有用的信息和知识的过程。 数据挖掘(data mining)技术产生了十几年的时间,在商业、工业生产及教育业中已经得到了广泛的应用,并取得了一定的经济和社会效益。但是数据挖掘在医学领域方面的应用还处于初步阶段,这是由医学数据的独特性造成的。

数据挖掘的应用 医学领域存在着大量的数据,包括大量关于病人的病史、诊断、检验和治疗的临床信息、药品管理信息、医院管理信息等,医学数据的复杂性,造就了数据的特殊性。主要模式包括多态性、不完整性、实践性和冗余性。这些特性使得医学数据的收集和研究,与其他行业的数据存在很大的差异。因此,如果想利用医学数据进行研究,必须对这些数据进行一定的清理和过滤,确保数据的一致性及私密性。

数据挖掘的应用 数据挖掘在分析医学数据的研究中可以大致分为以下三类: (1)聚类分析:可以把得到的医学数据分别归在一些子集里面。 (2)关联分析:在科研方面,可以分析临床病症与药之间的关系、临床病症与药复方之间的关系、临床病症与化学成分之间的关系,建立一些关联规则。 (3)预测行为:通过已知病历的数据挖掘,学习到新的预测病例的方法,可以提前预测疾病的发生,及时救治患者的生命。

数据挖掘的应用 目前对于数据挖掘在医疗领域的应用主要集中在以下几个方面: 数据挖掘在医院管理部门的应用; 数据挖掘在基础医学领域的应用; 在疾病的临床诊断和治疗方面的应用; 在流行病方面的预测; 在药物研究开发中的应用。

数据挖掘的方法 对医学数据库进行数据挖掘和知识发现的主要目 的是预测疾病和对疾病进行分类。分类和预测是两种 数据分析形式,可以用于描述重要数据类的模型或预 测未来的数据趋势。 数据挖掘的流程可以简单地分为以下几个步骤:确定目地;数据准备;确定方法;进行挖掘;结果分析;知识运用。也可以粗略地理解为三部曲:数据准备(data preparation)、数据挖掘(data mining),以及结果的解释评估(iterpretation and evaluation)。将数据挖掘技术应用到医学信息数据库中,可以发现其中的医学诊断规则和模式,从而辅助医生进行疾病诊断,实现临床决策支持的效果。

数据挖掘的方法 一、数据挖掘的主要步骤 (一)数据准备 (1)数据预处理:数据清洗,数据集成(采样), 数据转换和数据消减。 (2)因为医学信息涉及到患者隐私问题,因此还 需要特别的数据处理,对患者的资料和医学记录进行 匿名化(从记录中去除患者的标识)或者标识转换 (隐藏患者真实信息),分离患者与患者记录之间的 关联关系。 (3)需要对临床数据的文本数据进行标准化处理。

数据挖掘的方法 (二)数据采掘 (1)产生假设:发现型(discovery-driven):让数据 采掘系统为用户产生假设。验证型(verification-driven): 用户自己对数据库中可能包含的知识提出假设。 (2)选择合适的工具。 (3)发掘知识的操作。 (4)证实发现的知识。 (三)结果表达和解释 把结果表现出来,并且对信息进行过滤处理,如 不满意,重复的第(二)步。

数据挖掘的方法 二、数据挖掘的主要方法 对于医疗数据的挖掘,目前,数据挖掘的主要 技术为聚类、关联规则、决策树、粗糙集、神经网 络和遗传算法等方面。比如对海量的数据进行分类, 以便接下来的数据挖掘的聚类分析;找到药症之间, 药与药之间等相关的关系的关联方法;对未来的数 据进行预测的决策树方法等。

数据挖掘的方法 (1)聚类分析(clustering analysis) 聚类分析是对输入集中的记录进行分类。根据一 定的规则,合理地进行分组或聚类,并用显式或者隐 式的方法描述不同的类别。将数据聚集成类,使得类 间的相似性最小,而类内的相似性尽可能大。 聚类分析是一种探索性的统计分析方法,是在没 有先验知识的情况下对数据资料进行分类,其实质就 是按照资料的内在相似或相关程度将数据分为若干个 类别,以使得类别内数据的“差异”尽可能小,类别 间“差异”尽可能大。

数据挖掘的方法 (2)关联分析 表示数据库中一组对象之间某种关联关系的规则, 挖掘一个事件和其他事件之间依赖或关联的知识。如 果两项或多项属性之间存在关联,那么其中一项的属 性值就可以依据其他属性值进行预测。关联规则的挖 掘问题就是在给定的事务数据库中,找出满足最小支 持度(minsup)和最小置信度(minconf)的关联规则。 关联规则有如下优点:可以产生清晰有用的结果; 支持间接数据挖掘;可以处理变长的数据;计算的消 耗量可以预见。

数据挖掘的方法 (3)决策树 首先通过一批已知的训练数据建立一颗决策树 (decision tree);然后,利用建好的决策树,对数据进 行预测。这是一种用树枝状展现数据受各变量影响情 况的分析预测模型,根据对目标变量产生效应的不同, 而制定分类规则,它是建立在信息论基础之上对数据 进行分类的一种方法。 决策树的建立过程是数据规则的生成过程,因此 这种方法实现了数据规则的可视化,其输出结果容易 理解,精确度较好,效率较高,因而较常用。

数据挖掘的方法 三、结论 聚类分析、关联分析以及决策树是医学数据挖 掘中的主要方法,三者的结合,可以对某一类疾病 进行系统的分析,从疾病证候的分类,以及疾病与 药物之间的关联、证候与药物的关联,到最后通过 疾病的前期症状,对其的早期预测,以及定义相关 疾病的诊疗路径提供了很大的帮助。

谢谢,同学们辛苦了!