Chinese Virtual Observatory

Slides:



Advertisements
Similar presentations
四川财经职业学院会计一系会计综合实训 目录 情境 1.1 企业认知 情境 1.3 日常经济业务核算 情境 1.4 产品成本核算 情境 1.5 编制报表前准备工作 情境 1.6 期末会计报表的编制 情境 1.2 建账.
Advertisements

主编:邓萌 【点按任意键进入】 【第六单元】 教育口语. 幼儿教师教育口 语概论 模块一 幼儿教师教育口语 分类训练 模块二 适应不同对象的教 育口语 模块三 《幼儿教师口语》编写组.
第一組 加減法 思澄、博軒、暐翔、寒菱. 大綱 1. 加減法本質 2. 迷思概念 3. 一 ~ 七冊分析 4. 教材特色.
海南医学院附 院妇产科教室 华少平 妊娠合并心脏病  概述  妊娠、分娩对心脏病的影响  心脏病对妊娠、分娩的影响  妊娠合病心脏病的种类  妊娠合并心脏病对胎儿的影响  诊断  防治.
植树节的由来 植树节的意义 各国的植树节 纪念中山先生 植树节的由来 历史发展到今天, “ 植树造林,绿化祖国 ” 的热潮漫卷 了中华大地。从沿海到内地,从城市到乡村,涌现了多少 造林模范,留下了多少感人的故事。婴儿出世,父母栽一 棵小白怕,盼望孩子和小树一样浴光吮露,茁壮成长;男 女成婚,新人双双植一株嫩柳,象征家庭美满,幸福久长;
客户协议书 填写样本和说明 河南省郑州市金水路 299 号浦发国际金融中 心 13 层 吉林钰鸿国创贵金属经营有 限公司.
浙江省县级公立医院改革与剖析 马 进 上海交通大学公共卫生学院
第二章 环境.
教师招聘考试 政策解读 讲师:卢建鹏
了解语文课程的基本理念,把握语文素养的构成要素。 把握语文教育的特点,特别是开放而有活力的语文课程的特点。
北台小学 构建和谐师生关系 做幸福教师 2012—2013上职工大会.
福榮街官立小學 我家孩子上小一.
第2期技職教育再造方案(草案) 教育部 101年12月12日 1 1.
企业员工心态管理培训 企业员工心态管理培训讲师:谭小琥.
历史人物的研究 ----曾国藩 组员: 乔立蓉 杜曜芳 杨慧 组长:马学思 杜志丹 史敦慧 王晶.
教育部高职高专英语类专业教学指导委员会 刘黛琳 山东 • 二○一一年八月
淡雅诗韵 七(12)班 第二组 蔡聿桐.
第七届全国英语专业院长/系主任高级论坛 汇报材料
小數怕長計, 高糖飲品要節制 瑪麗醫院營養師 張桂嫦.
制冷和空调设备运用与维修专业 全日制2+1中等职业技术专业.
会计信息分析与运用 —浙江古越龙山酒股份有限公司财务分析 组员:2006级工商企业管理专业 金国芳 叶乐慧 魏观红 徐挺挺 虞琴琴.
第六章 人体生命活动的调节 人体对外界环境的感知.
芹菜 英语051班 9号 黄秋迎 概论:芹菜是常用蔬菜之一,既可热炒,又能凉拌,深受人们喜爱。近年来诸多研究表明,这是一种具有很好药用价值的植物。 别名:旱芹、样芹菜、药芹、香芹、蒲芹 。 芹菜属于花,芽及茎类。
2012年 学生党支部书记工作交流 大连理工大学 建工学部 孟秀英
1、什么是预算会计? 2、预算会计的组成体系? 3、预算会计的要素和会计等式? 4、预算会计的特点?
北京市职业技能鉴定管理中心试题管理科.
2014吉林市卫生局事业单位招聘153名工作人员公告解读
各類所得扣繳法令 與申報實務 財政部北區國稅局桃園分局 103年9月25日
初級游泳教學.
爱国卫生工作的持续发展 区爱卫办 俞贞龙.
第八章 数学活动 方程组图象解法和实际应用
本课内容提要 一、汇率的含义 二、汇率变化与币值的关系 三、汇率变化的影响. 本课内容提要 一、汇率的含义 二、汇率变化与币值的关系 三、汇率变化的影响.
散文鉴赏方法谈.
比亚迪集成创新模式探究 深圳大学2010届本科毕业论文答辩 姓名:卓华毅 专业:工商管理 学号: 指导老师:刘莉
如何撰写青年基金申请书 报 告 人: 吴 金 随.
点击输 入标题 点击输入说明性文字.
國際志工海外僑校服務 越南 國立臺中教育大學 2010年國際志工團隊.
第六章健康教育 神木职教中心医学系.
痰 饮.
學分抵免原則及 學分抵免線上操作說明會.
教 学 查 房 黄宗海 南方医科大学第二临床医学院 外科学教研室.
评 建 工 作 安 排.
“十二五”国家科技计划经费管理改革培训 概预算申报与审批 国家科学技术部 2012年5月.
“十二五”国家科技计划经费管理改革培训 概预算申报与审批 国家科学技术部 2012年5月.
首都体育学院 武术与表演学院 张长念 太极拳技击运用之擒拿 首都体育学院 武术与表演学院 张长念
现行英语中考考试内容与形式的利与弊 黑龙江省教育学院 于 钢 2016, 07,黄山.
第5讲:比较安全学的创建 吴 超 教授 (O)
彰化縣西勢國小備課工作坊 新生入學的班級經營 主講:黃盈禎
重庆市西永组团K标准分区基本情况介绍.
西貢區歷史文化 清水灣 鍾礎營,楊柳鈞,林顥霖, 譚咏欣,陳昭龍.
所得稅扣繳法令與實務 財政部北區國稅局桃園分局 102年12月19日 1 1.
角 色 造 型 第四章 欧式卡通造型 主讲:李娜.
走进校园流行 高二15班政治组 指导老师:曾森治老师.
医院文化建设 广东省中医院 2011年3月26日.番禺.
案例:海底捞模式 ——把服务做到极致.
医疗法律法规培训 连云港市东辛农场医院 周卫平 二0一四年十二月.
史泰博出货检验员面试中·········
09英本2班 罗芬.
个人所得税 扣缴申报表填报讲解.
主講人:孫台義 教授 哈薩克大學國際關係學院 客座教授
土地增值税清算业务培训 主讲人:吴金娟 怀集地税.
实训报告 财务管理二班 第三小组 组长:董文芳 执笔人:王瑾 组员:汲伦 庞宁宁 姜美.
义务教育英语(7—9年级) 教学指导意见.
Http://
儿科护理 说课 李国琴.
資源中心辦理補救教學之推動重點 服務單位:國立新竹教育大學 演 講 者:林志成教授.
師資培育中心外埠教育參觀.
面向海量数据的 高效天文交叉证认的研究 答辩人:赵青 指导老师:孙济洲 教授 天津大学计算机学院
中鸣虚拟搜救比赛项目 (一人) 现场主题创作(40%)(一人) 3D虚拟搜救(60%)(一人).
講題 :課程發展委員會的組織與運作機制 主講人:臺北市立明倫高中 教務主任王文珠.
Presentation transcript:

Chinese Virtual Observatory 大数据量交叉证认 算法研究 高丹 中国虚拟天文台研发团队

内容 星表介绍 交叉证认的意义 现有的交叉证认工具 交叉证认概念 交叉证认方法比较 进一步工作 B-tree索引 HTM索引 HTM索引分区+kdtree 进一步工作 China-VO 2006, Guilin 11/29-12/03

星表 星表是包含天体信息(如赤经、赤纬、星等、流量)的二维数据表格 多波段:光学、红外、射电、X射线等 星表的每一行对应一个天体,不同星表的同一天体的共同属性是位置信息 赤经:0~360度 赤纬:-90~90度 China-VO 2006, Guilin 11/29-12/03

星表实例 China-VO 2006, Guilin 11/29-12/03

交叉证认的必要性 多波段数据急剧增长 革命性步骤:数据融合 联系桥梁:位置交叉证认 China-VO 2006, Guilin 11/29-12/03

交叉证认的意义 多波段数据融合,获得天体多波段信息 对天体的物理性质、演化规律获得更全面系统的认识 为进一步的统计分析、数据挖掘做准备 提取天体的参数越多,越有利于天体分类和测光红移的计算 增加了发现新天体的概率 LAMOST三大核心子课题之一 虚拟天文台数据融合必由之路 China-VO 2006, Guilin 11/29-12/03

现有的交叉证认工具 SIMBAD ALADIN NED MAST TOPCAT OpenSkyquery GVO-cross-match China-VO 2006, Guilin 11/29-12/03

现有工具的优缺点 优点: 缺点: 界面友好 数据资源丰富 不能进行大样本的交叉证认 参数不能自由选择 交叉证认结果需要用户进一步加工 没有对结果进行分类 没给出交叉证认的概率 只能与特定的数据交叉证认 China-VO 2006, Guilin 11/29-12/03

交叉证认的概念 将不同星表或数据库中的源按位置属性将它们联系起来,在相同位置的源或一定误差半径范围内的源,被证认为是同一天体。 China-VO 2006, Guilin 11/29-12/03

证认的判断方法 (1) 有两个源分别在星表a、b中,它们的误差半径分别为r1,r2,它们的之间的球面距离为d。如果它们的关系满足 ,则认为它们是同一天体。 (1) China-VO 2006, Guilin 11/29-12/03

证认的判断方法(例子) 2MASS:r1=0.1 ra=357.661036243116, decl=0.434507548194 SDSS:r2=0.1 ra=357.661059, decl=0.434484 d:0.000032746961 两个源满足(1)式,被证认为同一个天体 China-VO 2006, Guilin 11/29-12/03

索引 Indexing mechanisms used to speed up access to desired data. China-VO 2006, Guilin 11/29-12/03

B-tree索引的交叉证认 为星表的ra,decl两列建B-tree索引 以小表为中心,在大表中遍历寻找证认源 以(1)式为判断 算法复杂度O(N*N) China-VO 2006, Guilin 11/29-12/03

B-tree索引的交叉证认(续) China-VO 2006, Guilin 11/29-12/03

B-tree索引方法优缺点 优点: 缺点: 证认精度高 内存限制,索引不好 速度慢,算法复杂度高 China-VO 2006, Guilin 11/29-12/03

HTM The Spatial Index is a quad tree of spherical triangles. The tree is built in the following way: Start out with 8 triangles on the sphere using the 3 main circles to determine them. Then, every triangle can be decomposed into 4 new triangles by drawing main circles between midpoints of its edges China-VO 2006, Guilin 11/29-12/03

HTM pcode ra=45.0 , decl=66.0, level=14 N313330303330003 China-VO 2006, Guilin 11/29-12/03

HTM level Level Area (arcmin^2) Num Leaves 10 1.77E1 8,388,608 China-VO 2006, Guilin 11/29-12/03

HTM索引的交叉证认 由星表的精度选取一定的HTM级数 由星表的ra,decl计算出HTM pcode值 两个B-tree索引 一个空间索引 N*N遍历 自然连接 省去(1)式判断,要求两个星表级数一样,即精度差不多 China-VO 2006, Guilin 11/29-12/03

HTM索引的交叉证认(续) China-VO 2006, Guilin 11/29-12/03

HTM索引方法优缺点 优点: 缺点: 索引好,空间索引解决了内存限制问题 速度慢,没有解决算法复杂度问题 认证精度低 漏源概率高 大量一对多、多对一混杂 要求两个表精度差不多 China-VO 2006, Guilin 11/29-12/03

HTM索引分区+kdtree的交叉证认 以小表为中心,把HTM索引当作分区 对每个分区的大表,把ra、decl作为参数建kdtree 用(1)式证认判断 HTM级数比星表精度低,漏源可能性小 China-VO 2006, Guilin 11/29-12/03

HTM索引分区+kdtree方法优缺点 优点: 缺点: 索引好,空间索引解决了内存限制问题 分区,算法复杂度降低,速度快 证认精度高 China-VO 2006, Guilin 11/29-12/03

进一步工作 进一步改进和优化算法 尝试其他索引算法,如HEALpix 优化交叉证认界面 实现参数自由选择和加工 计算证认的概率 提供与上层的数据挖掘和可视化工具的接口 集成一些现有的数据挖掘算法,开发面向天文 数据特点的挖掘工具 China-VO 2006, Guilin 11/29-12/03

Thank you ! Q & A ? www. .org China-VO 2006, Guilin 11/29-12/03