科学数据网格虚拟天文台进展 中科院计算机网络信息中心 罗 泽 2005年11月25日.

Slides:



Advertisements
Similar presentations
Chapter 3: SQL.
Advertisements

计算机网络课程总结 一、计算机网络基础 计算机网络定义和功能、基本组成 OSI/RM参考模型(各层的功能,相关概念, 模型中数据传输 等)
LSF系统介绍 张焕杰 中国科学技术大学网络信息中心
第三章 数据类型和数据操作 对海量数据进行有效的处理、存储和管理 3.1 数据类型 数据源 数据量 数据结构
在PHP和MYSQL中实现完美的中文显示
国家高技术研究发展计划 香港大学网格节点 Presented by Cho-Li Wang
J2EE与中间件技术 ——Lab.
Information & Security System in China China North Eastern Air Traffic Control Bureau (CAAC) Customer Background Subsidiary of General Administration of.
有机所文献利用快速指南 平台入口: 图书馆网站 文献、数据检索:
基于R和pentaho的全套开源BI平台的实现
Kvm异步缺页中断 浙江大学计算机体系结构实验室 徐浩.
如何使用CiteSpace分析Derwent专利数据
LSF系统介绍 张焕杰 中国科学技术大学网络信息中心
Hadoop I/O By ShiChaojie.
PHP與MySQL 入門學習指南 凱文瑞克 著 第 23 章 資料型別.
第二讲 搭建Java Web开发环境 主讲人:孙娜
面向对象建模技术 软件工程系 林 琳.
Chinese Virtual Observatory
R in Enterprise Environment 企业环境中的R
李杰 首都经济贸易大学 安全与环境工程学院 个人主页:
大学计算机基础 典型案例之一 构建FPT服务器.
SVN服务器的搭建(Windows) 柳峰
第11章:一些著名开源软件介绍 第12章:服务安装和配置 本章教学目标: 了解当前一些应用最广泛的开源软件项目 搭建一个网站服务器
大数据管理技术 --NoSQL数据库 HBase 陈 辉 大数据分析技术.
第一讲: 基本流程(1).
第十章 IDL访问数据库 10.1 数据库与数据库访问 1、数据库 数据库中数据的组织由低到高分为四级:字段、记录、表、数据库四种。
科研信息管理工具 Endnote X4 王辉.
以ISI平台为例,为您演示一下如何在Endnote文献中查看该文献的References
第17章 网站发布.
2019/1/12 GDP设计协同 超级管理员操作手册 GDP项目组.
数据挖掘工具性能比较.
PaPaPa项目架构 By:Listen 我在这.
走进中国科技网 中国科技网 李辉.
1085至1125年间的官员地域分布与社会关系 1.
Unit 11.Operating System 11.1 What’s OS 11.2 Related Courses
程序设计工具实习 Software Program Tool
SOA – Experiment 2: Query Classification Web Service
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
新一代安全网上银行 小组成员:杨志明 王晶 任毅 刘建中 关昊 刘超.
C语言程序设计 主讲教师:陆幼利.
学习目标 1、什么是字符集 2、字符集四个级别 3、如何选择字符集.
2019/4/16 关注NE官方微信,获取更多服务.
VisComposer 2019/4/17.
提供机构:XXXXXXXXX 机构级别:X级X等(无级别可不填写)
商业分析平台-语义元数据 用友集团技术中心 边传猛 2013年 11月 06日.
VB与Access数据库的连接.
Cassandra应用及高性能客户端 董亚军 来自Newegg-NESC.
2019/4/26 关注NE官方微信,获取更多服务.
计算机网络与网页制作 Chapter 07:Dreamweaver CS5入门
<编程达人入门课程> 本节内容 内存的使用 视频提供:昆山爱达人信息技术有限公司 官网地址: 联系QQ: QQ交流群: ,
Web安全基础教程
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
JSP实用教程 清华大学出版社 第2章 JSP运行环境和开发环境 教学目标 教学重点 教学过程 2019年5月7日.
iSIGHT 基本培训 使用 Excel的栅栏问题
2019/5/8 第2章 数据分析软件介绍.
魏新宇 MATLAB/Simulink 与控制系统仿真 魏新宇
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
虚拟天文台数据访问服务 VODAS 杨 阳.
计算机绘图 AutoCAD2016.
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
实验目的:掌握数据的顺序存储结构及它们在计算机中的操作。 实验内容:
第六章 Excel的应用 五、EXCEL的数据库功能 1、Excel的数据库及其结构 2、Excel下的数据排序 (1)Excel的字段名行
基于列存储的RDF数据管理 朱敏
Chinese Virtual Observatory
VB与Access数据库的连接.
PPT宝藏网最新整理发布- WPS Office Simple, Powerful and free.
FVX1100介绍 法视特(上海)图像科技有限公司 施 俊.

入侵检测技术 大连理工大学软件学院 毕玲.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Presentation transcript:

科学数据网格虚拟天文台进展 中科院计算机网络信息中心 罗 泽 2005年11月25日

提纲 中科院计算机网络信息中心介绍 项目背景 虚拟天文台工作进展

中科院计算机网络信息中心 中国科学院计算机网络信息中心(Computer Network Information Center, CNIC)是中国科学院下属的科研事业单位。主要从事中国科学院信息化建设、运行与支撑服务,以及计算机网络技术、数据库技术和科学工程计算的研究与开发。 中科院计算机网络信息中心是中国科学院“十五”信息化建设项目的牵头实施单位。

主要业务 中国科技网的建设、运行和管理 中国域名注册和地址分配服务 网上应用开发和信息服务 科学数据库资源建设和应用服务 超级计算应用与服务 国家网络科普基地 计算机网络技术、数据库技术、大规模科学与工程计算等前沿技术的跟踪和研究 办公室自动化和管理信息系统的建设、运行和技术支撑服务

背景 虚拟天文台的建立和实现需要网格技术的支持 虚拟天文台的最终发展目标就是实现全球天文数据的高级共享,同时提供一整套的智能化工具。TB量级甚至PB量级大型天文数据产出项目的不断涌现,对数据存储、数据管理、数据传输、数据检索等技术提出了更高的要求。在如此海量分布式数据的基础上进行科学研究,就必须有全新的数据共享、数据互操作、作业调度、数据可视化、数据统计分析、数据挖掘、数据安全管理等工具的支持。这些需求正是网格技术,特别是数据网格技术要实现的目标。

背景 虚拟天文台为网格技术提供最好的试验场 天文数据绝大部分是开放数据。国际上许多大型天文观测项目的观测数据都会及时在互联网上公布,这为数据共享提供了良好基础。 天文数据很少有商业价值。这意味着相互之间不存在保密性的问题,可以将数据和结果进行自由共享,非常适合国际性的联合研究与试验。 天文数据是海量的数据。例如美国正计划建造的“暗物质望远镜”,每天的观测数据高达18TB。这非常适合网格环境下海量数据处理和数据挖掘算法的研究。 天文数据是真实而归档完好的数据,并提供在线访问服务。 天文数据是高度复杂的数据。海量高度复杂的数据对数据处理、数据挖掘、可视化等研究提出了挑战。

背景 中科院国家天文台和中科院计算机网络信息中心携手合作,共同在863重大专项“高性能计算机及其核心软件”的应用网格“科学数据网格”中承担了虚拟天文台的研究和开发工作。 项目2002年10月立项,2005年11月结题

工作进展 天文数据的整理、发布,提供统一访问 天文软件封装,天文处理工具 两个应用示例 CDS;2MASS;Hipparcos;Tycho;Other 天文软件封装,天文处理工具 Dss星图检索;GSC1.2星表查询;USNO星表查询;基本天文计算服务;VO服务自动封装系统;VOFilter等。 两个应用示例 银河系化学元数丰度梯度统计分析; 2MASS巡天星表搜寻OB星协研究银河系的旋臂结构

天文数据的整理、发布 CDS Proposed solution CDS chose to keep the astronomical catalogues as plain ascii files, and to store the description of the catalogue as a separate ascii file. This description file includes all the necessary information related to the catalogue: author(s), reference(s) of the related published papers, brief summary, scientific keys, caption and accurate description of each table of the catalogue. plain ascii files+ description file

天文数据的整理、发布 plain ascii files+ description file 不利于天文数据的使用 不利于天文应用的集成 不易查询、搜索、过滤、联合等数据处理 解决方案:将表列数据整理到关系数据库中,利用关系数据库管理数据,利用关系数据库提供的API访问数据。 不利于天文应用的集成 没有提供一种统一的方式对数据进行处理,访问方式多样(下载,转换等),访问模式固化(执行固定的操作),不具备位置透明性,只实现简单共享。 解决方案:用Web服务方式封装数据库资源,通过Web服务PortType实现统一的数据访问和处理,提供高层的数据资源共享

CDS数据整理 由文本文件--〉关系数据库(MySql) 根据每个Catalogue中的ReadMe进行整理转换。 6180 Catalogues available from CDS 我们整理了一共5023个catalogues Obsoletes Binary ReadMe file Contents 参见 http://vizier.u-strasbg.fr/doc/catstd-3.1.htx

CDS数据整理 一、概况数据库 数据库CdsCatalogSummary +-----------------------------+ | Tables_in_CdsCatalogSummary | | Summary | 包含一个数据表Summary;

CDS数据整理 Summary Schema catalogPath:在CDS目录结构中Catalogue所在的目录; +-------------+--------------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | | catalogPath | varchar(255) | | | | | | content | blob | YES | | NULL | | catalogPath:在CDS目录结构中Catalogue所在的目录; Content:摘自Catalogue ReadMe中关于Catalogue的介绍

CDS数据整理 二、Catalogue数据库(以Catalogue /I/100A为例) +------------------+ | Tables_in_I_100A | | CatalogInfo | | FileContents | | FileTableMapping | | w10_dat | | w10_dat_meta | | w25_dat | | w25_dat_meta | | w50_dat | | w50_dat_meta |

CDS数据整理 CatalogInfo Schema +--------------+-------------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | | catalogName | varchar(32) | | | | | | catalogTitle | blob | YES | | NULL | | | Description | blob | YES | | NULL | | | fileSummary | blob | YES | | NULL | | catalogName:Catalogue的名称; catalogTitle:Catalogue的标题(来自ReadMe文件); Description:关于Catalogue的描述(来自ReadMe文件); fileSummary:Catalogue相关文件的总结,包括文件名称和文件简介(来自ReadMe文件)。

CDS数据整理 FileContents Schema +-------------+------------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | | fileName | blob | | | | | | type | char(1) | YES | | NULL | | | fileContent | mediumblob | YES | | NULL | | fileName:文件名称(来自ReadMe); Type:文件类型(C表示转换为关系数据表,N表示不能转换); fileContent:文件内容的具体描述(来自ReadMe)

CDS数据整理 FileTableMapping Schema +---------------+--------------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | | fileName | varchar(255) | | | | | | metaTableName | varchar(255) | YES | | NULL | | | dataTableName | varchar(255) | YES | | NULL | | | explanation | blob | YES | | NULL | | fileName:转换为关系数据表的文件的名称; metaTableName:对应该文件存储元数据的表名称; dataTableName:对应该文件存储数据的表名称; Explanation:对应该文件内容的简要解释。

CDS数据整理 *_meta schema +--------------+-------------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | | Lable | varchar(32) | YES | | NULL | | | Units | varchar(32) | YES | | NULL | | | Formats | varchar(16) | YES | | NULL | | | Bytes | varchar(16) | YES | | NULL | | | Explanations | blob | YES | | NULL | | Lable:存储数据表的字段名称; Units:该字段的单位; Formats:该字段的数据格式; Bytes:该字段在数据文件中的位置; Explanations:该字段的简要解释;

CDS数据整理 数据表Schema,根据元数据表,各不相同 +-------+------------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | | ID | varchar(5) | YES | | NULL | | | DM | varchar(8) | YES | | NULL | | | mag | varchar(5) | YES | | NULL | | | RAh | char(2) | YES | | NULL | | | RAm | char(2) | YES | | NULL | | | RAs | varchar(6) | YES | | NULL | | | pmRA | varchar(6) | YES | | NULL | | | DE- | char(1) | YES | | NULL | | | DEd | char(2) | YES | | NULL | | | DEm | char(2) | YES | | NULL | | | DEs | varchar(5) | YES | | NULL | | | pmDE | varchar(6) | YES | | NULL | | | o_RAh | char(3) | YES | | NULL | | | o_DEd | char(3) | YES | | NULL | | | EpRA | varchar(7) | YES | | NULL | | | EpDE | varchar(7) | YES | | NULL | | | cat | varchar(5) | YES | | NULL | |

CDS Web Service封装 采用Web Service封装CDS数据资源,提供统一访问,定义以下接口: String getDBName(String CatalogPath) 输入参数类型:String 输入参数CatalogPath是CDS对应Catalogue在目录结构中的位置,如:/I/108A; 输出参数类型:String 输出参数是该Catalogue对应的数据库的名称,当CataloguePath不存在,或CatalogPath对应的星表已过期(=Obsolete=),则返回null。

CDS Web Service封装 String getTableName(String catalogPath, String fileName); 输入参数catalogPath类型:String; 输入参数catalogPath是CDS对应Catalogue在目录结构中的位置,如:/I/108A 输入参数fileName类型:String; 输入参数fileName是Catalogue中文件的名称 输出参数类型:String; 输出参数是该catalogPath中对应文件fileName在CDS数据库中的表名称,如果文件不存在,或文件不能转换为关系表,那么返回为null。

CDS Web Service封装 String getMetaTableName(String catalogPath, String fileName); 输入参数catalogPath类型:String; 输入参数catalogPath是CDS对应Catalogue在目录结构中的位置,如:/I/108A 输入参数fileName类型:String; 输入参数fileName是Catalogue中文件的名称 输出参数类型:String; 输出参数是该catalogPath中对应文件fileName在CDS数据库中的元数据表名称,如果文件不存在,或文件不能转换为关系表,那么返回为null。

CDS Web Service封装 String queryCDS(String strSql); 输入参数类型:String; 输入参数strSql是查询CDS关系数据库的sql语句; 输出类型:String; 输出参数是该查询返回的结果,如果无结果,返回null。

CDS发布平台建设 参考http://portal.sdg.ac.cn Web服务前端(考虑用portlet实现) 另有一页对相关的Web Service进行介绍。

CDS发布平台建设 其他天文数据( 2MASS;Hipparcos;Tycho;Other)的整理、服务封装和发布与CDS类似

天文软件封装,天文处理工具 DSS星图检索工具 通过网格服务的方式提供数字巡天图检索,初步实现一个虚拟天文望远镜的功能,通过输入区域参数,能够检索出相应区域的星空图,与天文学家通过天文望远镜观测星空类似。天文学家可在此基础上进行进一步的科研和试验分析。 参考http://portal.sdg.ac.cn

天文软件封装,天文处理工具 GSC1.2查询检索网格服务 结构:GSC导星目录需要提供“译码”和“查询”两个功能。因为GSC是以压缩的二进制的格式存储的天文数据,必须通过译码获得原始星表。与此同时,为了更加方便用户快速了解到具体详细的局部信息,还提供了查询功能。 参考http://portal.sdg.ac.cn

天文软件封装,天文处理工具 USNO查询检索网格服务

天文软件封装,天文处理工具 VO服务自动封装系统 VOFilter 基本天文计算服务 VOTable2XHTML China-VO注册中心 集成其他的VO工具,如aladin等

应用示例 《2MASS巡天星表搜寻OB星协研究银河系的旋臂结构》科学课题 基本思想 利用已观测到的OB星,在2MASS天文数据库中查找OB星的光谱范围,再将属于这个有效光谱范围的银河系天体可视化,通过相应的数据挖掘,其结果帮助研究银河系的旋臂结构。

应用示例 基本试验步骤 在Hipparcos和CDS天文数据库中,根据已观测到的OB星的坐标,查找它们的光谱范围; 将光谱范围做完约束,在2MASS天文数据库中搜索OB星候选体的坐标; 坐标变换; 可视化OB星候选体,观察旋臂结构.

应用示例 需求 分布、异构数据资源的统一访问和集成。 因为原始数据信息一般都分布在不同的地理位置,数据的存储格式及存储管理系统各不相同; 易用、可视化的问题求解环境,帮助科学家快速构造和修改试验流程。 在这个平台上定义通用的过程模型,支持用户在图形编辑环境下从库中选择各种有效的组件构造具体科学问题的求解模型,并自动收集执行的元数据。如此一来,天文工作者依照事先拟订好的试验步骤,协同、反复多次使用大量的分布、异构数据检索、数据计算、可视化、数据挖掘等资源,甚至可接受本地开发的程序,组合成有效的处理,进而开展天文研究工作。

应用示例 问题求解环境

应用示例 数据库

应用示例 演示

应用示例 银河系化学元素丰度梯度统计

谢谢!