机器学习与数据挖掘 可视化技术.

Slides:



Advertisements
Similar presentations
袁枚〈祭妹文〉. 你也有兄弟姊妹嗎? 你們之間有沒有感動的回憶呢? 有一種愛叫做-手足情深 … 兄弟姊妹又稱之為手足 是一種密不可分的關係與情感.
Advertisements

案件背后的生活智慧 上海市公安局治安总队黄奕 如何防范电信诈骗. 什么是 电信诈骗 主要指不法分子通过手机、固定电话、网络等现代通讯方式发布、传 播虚假信息,设下圈套,实施诈骗的违法犯罪行为。
秦代舞蹈 本檔案圖片來源: google 圖片. 戰國七雄終結者 統一文字制定律法 郡縣名田  秦王征服六國,終結分裂割 據的局面,建立中國歷史上 第一個中央集權的封建大帝 國,統一文字、制定律法與 郡縣、名田等制度,將戰國 時期散漫衰敗狀態的社會, 轉變成統一強大的國家。 秦始皇.
 来源: 新华网新华图片 背景音乐 365里路.
2017/2/ /2/25 1 公職考試與證照考試簡介 考選部 1.
强力打造湖北农业信息网 全面推进湖北农村信息化
黄金时代 黄金时代:老子,释迦牟尼,苏格拉底,孔子,庄子,耶稣…… 他们是人类智慧的顶峰,他们用人生展示了智慧与慈爱。
二00四年鼓勵公務人員提升英語能力宣導說明會
一百年後的世界裡, 人類掌握長生不死的秘密, 但伴隨而來的是……
王同学的苦恼﹗ MC 4.1 诚可贵﹗.
餐旅會計學 Ch2 借貸法則.
第一章 企業合併簡介.
報告人:朝陽科技大學保險金融管理系 施懿純 助理教授
软件学院软件技术系 《动漫角色造型设计》 天津电子信息职业技术学院
第四章 商代之舞蹈 本檔案圖片來源:google圖片.
「國土資訊系統自然環境基本資料庫分組─ 經濟地理資訊圖資建置第1期計畫」
嗇色園主辦可立小學 故宮 製作日期:2011年3月21日.
一、信息加工概述 1、信息技术是指与信息的获取、加工、表达、交流、管理、评价相关的技术。 2、信息加工的重要性: 原始信息 加工的信息
人 因 工 程 四室一B 黃雅勤 四室一B 黃曉楓 四室一B 鄭羽真 四室一B 張起順.
狂犬病 保護你我,愛護動物 武漢國中 黃憶暄.
保良局何壽南小學 使用牙膏對我們生活的影響 六年級專題報告 姓名﹕李燊樺 班別﹕6B 日期﹕
迪士尼動畫 玩具總動員1.
放射诊疗管理规定 何 伟.
中國歷史人物武則天 G組組員 韋紫恩, 余詩琪 蔡煦齡, 黃榮紳,.
課程實錄.
关于在宝钢全体党员中开展“学党章党规、 学系列讲话,做合格党员”学习教育的 实施方案
More『2』莊園 1+1 MORE 2 的秘密.
星球簡報 林宗佑 林宗佑.
金星~張晉嘉~ [金星] 是是八大行星中最第二靠 近太陽的行星,軌道半徑為 10,820萬公里 (0.72AU);直徑 為12,103.6公里,在九大行星中 大小排行是第六;質量是 4.869x1024公斤。金星的公轉軌 道是所有行星中最接近正圓的, 其偏心率不到1%。   金星早在史前就為人所知 了,它是全天亮度僅次於太陽及.
拯救企鵝,人人有責 >.< 報告人:李承恩、楊承峰 日期:104/3/19.
主講人:臺中市政府警察局 交通警察大隊 行政組組長簡仁照
動物的繁殖行為.
5,2 新时代的劳动者.
感知学习 ——可视化学习平台.
105年臺北市 優先免試入學 高中職免試入學 五專免試入學 報名方式宣導
行動報告人:丁俊源 行動參與人和單位: 我們全家人 社區鄰居、管委會 新北市環保局
熊貓 設計者:鄧澤怡 班別:6B2 學校:華德學校.
個人資料保護法簡介 報告人: 花蓮地檢署主任檢察官 許建榮.
情歌分享小組作業.
劳模的风采.
羅伯特-舒曼 0201第三組 38 蘇立庭 21 何鈺婷 27 張蓉宓 37 賴怡茜
心跳加快 安靜且無發燒時,心跳每分鐘120次以上 肌躍型抽搐 (睡眠中無故驚嚇/突然間肌肉收縮)
單車失竊記心得.
Assessment For Learning
跨校選課 說明會 主辦人:[國文系學會學權股] 葉軒如、李美玟.
交換生說明會 101學年度下學期 (2013年春季學期) 2013年2月18日 (工程一館106室)
永續發展 永續發展的意義.
雨後的濕地 夜晚的落葉層 清晨的姑婆芋下   你可能曾經和這個小精靈錯身而過…… 遇見蝸牛百分百 《蝸牛不思議》/遠流出版.
第二部分 免疫系统与免疫活性分子 第二章 免疫系统 第三章 免疫球蛋白 第二 部分 第五章 细胞因子 第四章 补体系统.
稅知多少.
中 级 财 务 会 计 李颖琦 上海立信会计学院.
Facebook 内部高效工作指南
欢迎、感谢、期待 朱爱民 Google 中国教育合作部.
第 1 章 人與地球環境 1-1 人與地球環境綜覽 1-2 探索地球的起源
第十一章 問卷和表格設計 「前測問卷是成功關鍵,所有守法的研究人員都 了解此點,絕不會拿未前測過的問卷來浪費大家的 時間和自身的努力。」
稅知多少 國家的重要基礎.
105學年度 服務學習教育說明會 Service Learning.
LSVT Voice Rehabilitation
105學年第1學期期初校務會議 圖書館工作報告 報告人: 林佩佳主任.
教學輔導教師 認證資料繳交說明 認證申請期間:108年4月10日至108年6月30日 請教師自行確認符合各項取證資格再行送件.
岗位聘任管理系统使用说明 浙江师范大学人事处 咨询电话: 、
地球 我之所以會做這個主題,是因為有一次我再閱讀書本的時候看到的, 和三年級自然老師上課也有講到,所以讓我更有興趣把他用清楚, 因此我每結下課都有到圖書館找有關地球的書本,所以我才會選地球當主題, 雖然我有一點懂,可是有一些地方我還是不懂‧ 作者:陳彥廷.
全陽圓格局位置最好的A6-2樓 面中庭花園3房2廳2衛三面採光 捷運藍線江子翠捷運站1號出口Google距離210公尺
百艳图.
饭店财务会计 Financial Accounting
東吳大學『樂齡大學』 外雙溪環境與生態 產業 黃顯宗 東吳大學 微生物學系 101.
官峰A+小豪宅 三面採光、通風採光極佳、 均有前後陽台、空間多元
关于复旦大学体锻制度的调查报告 仇璐 宛蓉.
多媒体搜索引擎 多媒体文档检索(2).
Presentation transcript:

机器学习与数据挖掘 可视化技术

可视化技术 MDS (MultiDimensional Scaling) 在低维空间显示高维数据的内在结构 可能有复杂的内部结构 可能无法嵌入低维空间 http://www.dianxinshi.com/ http://sherryhu1028.blog.163.com/ 2018年11月19日 Machine Learning

可视化技术 MDS (MultiDimensional Scaling) 已知对象的相互距离/相似度,显示结构 社交网络 无线传感器 机器人探测器 Mars Exploration Rover-B (NASA) http://www.space.rcast.u-tokyo.ac.jp/ kaname/ISTS_hapyou.ppt 2018年11月19日 Machine Learning

可视化技术 MDS (MultiDimensional Scaling) 通过对象间的距离/相似度,计算坐标 http://www.cs.ubc.ca/~tmm/courses/cpsc533c-04-spr/slides/0308.manske.ppt 2018年11月19日 Machine Learning

可视化技术 MDS (MultiDimensional Scaling) 数学方法 http://astro.temple.edu/~msobel/courses_files/Multidimensional%20Scaling.ppt 2018年11月19日 Machine Learning

可视化技术 双曲可视化(Hyperbolic Visualization) 人眼中心区分辨率极高 往外迅速降低 聚焦中心 适当保持背景 http://www.journalofoptometry.org/10.3921/joptom.2009.3.html 2018年11月19日 Machine Learning

可视化技术 双曲可视化(Hyperbolic Visualization) 可视化显示应该符合人眼的特性 中心显示更多细节 快速看到想看的信息 边缘保持更多全局联系 理解中心细节的背景信息 浏览过程中可以轻易变换视角 2018年11月19日 Machine Learning

可视化技术 双曲可视化(Hyperbolic Visualization) 双曲几何:符合人眼视觉特性 M.C. Escher http://commons.wikimedia.org/wiki/File:Hyperbolic_functions.svg 2018年11月19日 Machine Learning

可视化技术 双曲可视化(Hyperbolic Visualization) 适合树、图的可视化(子节点数指数增加) http://treebolic.sourceforge.net/ http://mathworld.wolfram.com/PoincareHyperbolicDisk.html 2018年11月19日 Machine Learning

可视化技术 相关反馈 反馈与检索是可视化技术的重要内容 相关反馈在可视化中是很重要的 可视化不仅包括向用户输出信息,还包括从用户输入人工处理后的信息 显示设备的硬件能力和人的视觉能力不可能让人把所有信息在瞬间全部获得 可视化过程是包含人的反复迭代过程 相关反馈在可视化中是很重要的 2018年11月19日 Machine Learning

相关反馈 相关反馈例:起始界面 http://nayana.ece.ucsb.edu/imsearch/imsearch.html 2018年11月19日 Machine Learning

相关反馈 相关反馈例:初始查询结果 2018年11月19日 Machine Learning

相关反馈 相关反馈例:用户标注反馈信息 2018年11月19日 Machine Learning

相关反馈 相关反馈例:改进的查询结果 2018年11月19日 Machine Learning

相关反馈 矢量空间相关反馈 对象(文档)用特征矢量表示,查询亦然 优化目标函数: sim (Q, Cr) - sim (Q, Cnr) X O O X X O O O X (N: 文档总数;余弦相似度) Q 2018年11月19日 Machine Learning

相关反馈 矢量空间相关反馈 问题:大多数文档的相关/不相关属性未知 Rocchio算法 初始查询 权重 2018年11月19日 Machine Learning

相关反馈 矢量空间相关反馈 计算简单,直观 可以同时提高精度和查全率 对查全率更有效 一些系统不使用非相关反馈(=0) 用户只有非常关心查全率时才愿意花时间反馈 查全率低的查询:相关文档被反馈的比例高得多,所以对相关文档的描述全面得多 不相关文档千差万别,难以描述 一些系统不使用非相关反馈(=0) 2018年11月19日 Machine Learning

相关反馈 矢量空间相关反馈 缺点:高维空间问题 高维空间的特性和三维空间很不一样 随着维数增加,此种情况的概率指数增加 文档矢量空间:数十万维 随着维数增加,此种情况的概率指数增加 2018年11月19日 Machine Learning

相关反馈 概率相关反馈 P(tk|R) = |Drk| / |Dr| P(tk|NR) = (Nk - |Drk|) / (N - |Dr|) 修改特征维的权重 不再保留初始查询 2018年11月19日 Machine Learning

相关反馈 使用的假设 用户有足够技能提交一个好的初始查询 相关模型是“优秀”的 如果初始查询很好,为何要反馈? 相关文档之间是相似的 高维空间…… 不相关文档之间也是相似的 至少是“聚类相似”的 “幸福的…相似,不幸的…各有各的不幸”:托尔斯泰 不相关文档和相关文档不相似 真的吗?(高维空间) 2018年11月19日 Machine Learning

相关反馈 搜索引擎中的使用情况 绝大多数都不使用相关反馈 弱反馈 反馈信息有限,性能提高有限 反馈代价昂贵,大型系统难以承受 操作复杂、时间长,用户不喜欢 弱反馈 Google “Similar Pages” Excite “More like this” 4%的查询使用此功能 只有约2/3的反馈可以提高性能 2018年11月19日 Machine Learning