FitHAS: FITS 头分析入库系统 于建军 中科院网络中心 主要内容 背景 FitHAS 体系结构 下一步工作 总结.

Slides:



Advertisements
Similar presentations
元大京華證券 組員名單 : A 楊之奇 A 廖本揚 A 宋俊承 A 陳冠廷 A 郭峻瑋 A 指導教授 : 許素華 副教授.
Advertisements

達悟族報告 作者 : 林琪崴, 許原碩 座號 :13 號,14 號 原碩負責 : 簡介, 傳說, 圖驣, 達悟族飛魚季, 琪崴 : 地理位置, 土地利用方式, 飲食文化, 豐收祭.
主讲:张天明 影像艺术工程师. 声音的聆听 指出听到的是什么物体发出的声音,这一 声音是在什么样的空间环境中传播的。 一、 答案: 1 、打气筒打气的声音 2 、手打打气筒给足球打气的声音 3 、手打打气筒给自行车轮胎打气的声音 4 、七次(七声)打气筒打气的声音 5 、(气流)摩擦的声音 6 、猪在发急时的叫声.
概念導向命題技巧與試題分析 臺灣師大地理系 陳國川. 教學評量是一種『抽樣調查』 實施教學評量時,需具備二項條件: 其一,瞭解命題的理論及其實踐的方法; 其二,瞭解各種題型的功能與命題方式。 壹、前言.
第十八章 林肯大郡 第十八章 林肯大郡災變緊急搶救應變措施 1997 年 8 月 18 日溫妮颱風襲台,汐止鎮 的林肯大郡山崩,遭崩場土石撞擊 1997 年 8 月 18 日溫妮颱風襲台,汐止鎮 的林肯大郡山崩,遭崩場土石撞擊造成二十八人罹難八十戶住宅倒塌的慘劇 此災變要喚起國人的重視 本章介紹搜救行動緊急應變措施。
高峰植物園行前解說 2005/12/07 By 羽明. 陽性先驅物種 陽性植物 --- 陽光需求量大 陰性 ( 或耐蔭性 ) 植物 --- 陽光需求量少, 或 日照太強反而無法生存 先驅植物 --- 森林大火或土石流地震後產生的 裸露空地, 先生長出來的植物.
報 告 人 : 胡 嘉 琪 ˙ˇ˙ 、 王 紫 庭 = ˇ = 台灣夜市文化 作者: 郭明澤‧私立明道高中‧綜二 4 班 馬炯修‧私立明道高中‧綜二 4 班.
5 ˙ 1 第五章 生物的協調作用 5 ‧ 1 神經系統. 5 ˙ 1 人體的神經系統 1. 協調動物生理反應的系統: 神經 系統、 內分 泌 系統。 2. 神經系統負責 統整 和 協調 。分為 中樞 神經 和 周圍 神經。 (1) 中樞神經包括 腦 和 脊髓 。 (2) 周圍 神經包括 腦神經 和.
从《西游》看大学生的成长 主讲人:颜廷学 时间: 地点:演艺大楼流行剧场.
新员工培训 设计部 思安新能源股份有限公司 主讲人: 韩少华 时 间:
前言:河流的主要功能 1. 交通運輸 優點-運費低廉,維護費用低 缺點-速度慢,裝載費時,不能到達生產區或消費區 的末端,需要轉載。 尚受到河流網路,河口位置,水量變化,河床 狀況,冰封時期 2. 水資源系統.
幽夢影~張潮 小佑子工作室 關於《幽夢影》 作者張潮,記寫他個人對人生世事之體驗透悟的 書。 書中文字,全為「語錄」形式,屬於格言,也是 最精鍊的隨筆。 全書可分為九卷:論才子佳人、論人與人生、論 朋友知己、論讀書、論閒情逸趣、論立身處世、 談文論藝、論四時佳景、論花鳥蟲魚。
成人高考高起点 语文 冲刺班 主讲老师:邓君媚. 复习指导 高考语文含四大块内容: 语言知识和语言表达,古代诗文阅读,现 代文阅读,写作。 在全面复习的前提下,按照《考试大纲》 的要求,要做好思路整理,建立高考的整体框 架的工作。认真归纳整理基础知识、培养基本 能力,复习做到有的放矢。 复习指导.
老师,我可以不 爱 吗? 山东省淄博市张店区实验中学 杜桂兰 星期一的早晨,我紧张而又兴奋,因为 我的赛教课就要开始了。 这是一次级别很 高 的竞赛。
中國 (China) 組長 : 葉品宏 組員 : 王柏偉、戴瑞賢、張凱奇、 曾宏榮、趙方澤 組長 : 葉品宏 組員 : 王柏偉、戴瑞賢、張凱奇、 曾宏榮、趙方澤.
财政部 国家税务总局 中国人民银行(央行) 银监会 证监会 保监会. 法定存款准备金率 利率 税率 政府投资 楼继伟,周小川,易纲.
油蔴菜籽 指導老師:陳瑜霞 學生: 商設一甲 謝旻璇 車輛三乙 許勝傑 工管四甲 彭凱雲. 作者介紹: 廖輝英( 1948 年生)臺大中文系畢業。 從初三開始寫作,早期作品多以散文為主,大四 畢業時才暫時封筆。畢業後進了廣告界,成為廣 告文案好手,後為企畫主管,在廣告界縱橫十餘 年,也曾任職於建設公司,辦過社區報高雄一周。
蘭嶼情人洞傳說 林庭羽製 林庭羽製. 台灣的蘭花特別多,台灣有個蘭 嶼島,島上面的蘭花更多.所以 叫蘭嶼.這裡留下了動人的傳說。
職業訪談報告. 成員 : 鐘怡君 劉沛君 謝明達 賴映辰.
南台科大幼保實習課程 見習幼兒園心得報告 夜四技幼保四甲 998i0021 黃欣婷.
第一章 生殖 1‧2 無性生殖.
高教三十条 — 科技创新能力提升 科技创新能力提升工程方案起草小组 2013年7月4日.
你不可不知之 十二年國教二三事 教務主任:傅瑞琪.
鞋 楦 的 材 質.
最古怪的15種動物.
走! 一起去拜訪筏子溪.
台灣文學館之旅.
單車環島之旅 組員: 495D0072 胡閎智 495D0074 何冠緯 495D0020 王怡雯 495D0047 葉亭君
 耕地分割 及 執 行 內政部地政司 視察:林玲女.
~完備、周密、迅速 ~ 行政院農業部畜產試驗所
建筑设计基础讲义 (02-1) 建筑水彩渲染.
現代文學導讀 (中國現代散文發展的歷史軌道)
关于省重点高校建设计划推进情况的汇报 杭州电子科技大学 2015 年 5 月 28 日.
指 导:高歌老师 责任编辑:汤杰林 杜峥 供 稿:课代表 班委会 团长 栏目创编:张廷信 技术编辑:汤杰林 杜峥 常务编辑:杜峥
日期: 六 福 村.
时间与我们的世界 Pb 段心蕊.
“三生教育”专题 生命·生存·生活.
天文学信息化建设初步设想 赵永恒 国家天文台 2006年11月.
PB级科研数据集的管理和应用 曙光信息产业(北京)有限公司.
保良局方王錦全小學 學校健康促進經驗分享    盧淑宜校長.
寻觅节日诗情.
共产党员致力 新疆油田信息化建设 数据公司信息业务党支部 2013年6月.
爱的表达方式.
?????? ?????? ?????? 他是我生的 我愛怎樣就怎樣 這樣對嗎? 影片欣賞.
第2课 古代手工业的进步 课标:列举古代中国手工业发展的基本史实,认识古代中国手工业发展的特征.
第六章 社会主义初级阶段理论 第一节 社会主义初级阶段是我国最大的实际 第二节 社会主初级阶段的基本路线和基本纲领
大肚宮廟巡禮 下一頁.
大嶼山 香港國際機場 及 寶蓮寺.
一 二 三 四 五 六 七 项目建设总体情况 建设工作机制与举措 项目建设进展 建设经费投入与使用 贡献与示范 典型案例
时代发展趋势: 科学人文交融 华中科技大学 杨叔子 2010年2月修改.
前不久看到了这样一则报道:某个大学校园里,一个大学生出寝室要给室友留一张字条,告诉他钥匙放在哪里。可是“钥匙”两个字他不会写,就问了其他寝室的同学,问了好几个,谁也不会写,没办法,只好用“KEY”来代替了。 请大家就此事发表一下自己看法。
重点难点 参考文献 教学目标 一、中央集权国家的建立 二、秦始皇巩固统一的措施 三、统一的多民族封建国家的形成 练习与思考.
虚拟天文台 -网格技术最好的试验场 The Chinese VIRTUAL OBSERVATORY 崔辰州 国家天文台
报告人:李珊珊 主要建设者:高兴 樊东卫 李珊珊 项目合作团队:星明天文台 中国虚拟天文台
利用共同供應契約 辦理大量訂購流程說明.
第四节 函数展开成幂级数 本节内容: 一、泰勒 ( Taylor ) 级数 二、函数展开成幂级数 第十二章 两类问题: 在收敛域内 求 和
虚拟天文台数据访问 客户端设计与实现 杨阳 指导老师: 赵永恒研究员、崔辰州副研究员.
第14章 總體經濟政策之爭論:法則與權衡性.
射电数据处理Gridding技术研究 国家天文台–天津大学 天文信息技术联合研究中心 罗琦、肖健、于策
香港傳統的農村生活.
2019/5/1 论文题目: 虚拟天文光学望远镜系统研究 报告人:徐灵哲.
地質篇 Unit_04_地質年代.
兒童及少年保護、 家庭暴力及性侵害事件、 高風險家庭 宣導與通報
中国农业科学院博士后学术论坛 博士后基金申请的经验及体会 中国农业科学院生物技术研究所 秦 华 博士
VO-enable LAMOST 国家天文台 赵永恒 2008年11月.
天文领域云--云平台系统 李长华 王甲卫 2019/5/26 On behalf of Astrocloud Project Team
中科院计算机网络信息中心 许海燕 科学数据网格与China-VO 中科院计算机网络信息中心 许海燕
Module_5_Unit_4_ppt Unit4:非线性系统的描述函数法 东北大学《自动控制原理》课程组.
中国科学院的e-Science 及其“十五”信息化建设
由一个佯谬看涡旋电流的存在 PB 田鸿翔 指导老师 万树德.
Presentation transcript:

FitHAS: FITS 头分析入库系统 于建军 中科院网络中心

主要内容 背景 FitHAS 体系结构 下一步工作 总结

背景 虚拟天文台环境 海量天文数据的存储和访问 e-Science/ 网格技术

虚拟天文台( Virtual Observatory ) 定义: – 利用先进的信息技术将各种天文研究资源以统一的服 务模式无缝透明地汇集到一起,形成一个统一的数据 密集型的网络化天文研究与科普教育平台 – 虚拟天文台吸收了网格等先进技术,将集成海量天文 资源,提供丰富的服务 核心问题是数据处理 – 海量天文数据是向天文学家和社会各界提供天文数据 服务的重要基础 – 需要在 VO 环境下有效地组织数据资源,挖掘海量数据 的潜力,从而使这宝贵的资源能为国内外的天文学家 乃至社会各界所更好地使用,真正发挥其巨大的作用

海量天文数据 目前: – 国际上公开的天文数据已经达到上百 TB 量级 – 一些观测项目的数据日产出数量甚至以十亿甚 至十万亿的量级来计算 未来: – 将达到 PB 量级 传统的数据存储和管理的方式已很难满足 海量天文数据的存储和访问要求

天文数据处理 在虚拟天文台环境下 – 如何对海量数据进行有效存储成为一个亟待解 决的问题 – 如何对海量数据进行快速有效的访问,也是关 系到虚拟天文台服务能力的重要课题

e-Science 技术 定义 –e-Science is about global collaboration in key areas of science, and the next generation of infrastructure that will enable it.” –By 英国 e-Science 倡导者 John Taylor, 2001

为什么要引入 e-Science 技术 解决现代科学研究的巨大挑战 – 科学研究问题空前复杂化 – 科学研究对象不是简单孤立系统,而是涵盖更 大的范围,跨学科 – 科研信息、数据的实时获取与处理,仿真与大 规模计算成为分析、发现和预测的主要手段 – 科学家之间密切的合作与交流

e-Science 的意义 使得全球性的、跨学科的、大规模科研合 作,跨越时间、空间、物理障碍的资源共 享与协同工作成为可能 将改变科学家们从事科研活动的方法和模 式,极大地促进交流合作,推动科学研究 的发展 科研信息化是整个社会信息化的前卫,是 下一代互联网络技术及信息基础设施在科 研领域的率先应用

网格技术 网格技术的最终目标: – 把整个互联网整合成一台巨大的超级计算机 – 实现计算资源、存储资源、数据资源、信息资 源、知识资源、专家资源的全面共享 – 为用户提供一步到位的服务 e-Science 的核心就是网格技术

e-Science 发展为 VO 提供技术支持 VO 的最终目的: – 实现全球天文数据的高级共享 – 提供一整套的智能化工具 –TB 量级甚至 PB 量级大型天文数据产出项目的不断涌现 VO 的技术需求: – 对数据存储、管理、传输、检索等技术提出了更高的 要求 – 在海量分布式数据的基础上进行科学研究, 就必须有全 新的数据共享、互操作、作业调度、可视化、统计分 析、数据挖掘、安全管理等模型。 VO 的这些需求正是 e-Science 要实现的目标!!!

VO 是 e-Science 的试验床 天文数据有着其他学科数据所无法比拟的特点: – 天文数据绝大部分是开放数据 天文数据很少有商业价值 不存在保密问题,数据和结果可自由共享,非常适合国际性的联 合研究与试验 – 天文数据是海量的数据 例如美国正计划建造的 “ 暗物质望远镜 ” ,每天观测数据高达 18TB – 天文数据是真实而归档完好的数据,并提供在线访问服务 – 天文数据是高度复杂的数据 对数据处理、数据挖掘、可视化等研究提出了挑战。 –VO 要实现对海量天文数据的融合 从 e-Science 网格基础设施的构建,到中间件的开发,最 后到 e-Science 天文应用工具的实现, VO 为 e-Science 提供 了一整套的应用需求

天文数据现状 天文数据 – 包括星表、图像、光谱 – 天文方面的文献和观测日志 – 这些数据一般以文件或数据库形式保存 天文数据文件格式 – 有普通文本文件、 FITS 、 VOTable – 目前很多观测数据以 FITS 文件保存 – 很多数据查询服务将结果包装成 VOTable 形式 – 这些大多是直接处理文件而且是少量文件的应 用

FitHAS 介绍 天文学灵活图像传输系统 FITS –Flexible Image Transport System – 美国 D.C.Wells 等人于 1979 年提出的 –1982 年国际天文协会 (IAU) 接受并推荐将其作为天文台之间 进行图像数据交换的标准格式。 – 在 FITS 的一般结构中,含有若干使用 ASCII 码编写的描述信 息,用于描述数据数组的结构、坐标系统以及附加参数等 –FITS 描述了数据定义和数据编码的一般方法,对一维、二维、 多维的数据类型都提供了合适的转换,不仅适用于天文数据, 还可用于其他学科的图像处理。 目前 FITS 对综合孔径、甚大阵、 CCD 观测记录,以及 CDS 发表的天文星表和 CD-ROM 星表,都提供了较好的 支持

Fits 文件格式 基本结构 – 包含一系列逻辑记录( logical record ),逻辑记录的长 度总是 2880 字节,因此一个 FITS 文件的大小是 2880 的 整数倍。 – 一个逻辑记录中,一般会包含一个或多个头部数据单 元( Header and Data Unit , HDU ) – 每个 HDU 是由一个头部以及其所描述的数据数组所组 成。 – 在一个 FITS 文件含有多个 HDU 时,第一个头部数据单 元也就是主头部数据单元 – 基本 FITS 文件包含主头部和一个主数据数组。 Fits 文件中图像数据 – 以 FORTRAN-77 规则存储,低字节在前

Fits 头部 FITS 的头部是通过一组卡片映象( Card image )来描述数据数组 – 每一个卡片映象都是一个 80 字节长的使用 ASCII 编码的字符串 – 这些卡片映象的最后需要以 “END” 关键词作为 结束标志,其后直到头部结束都用空格填满

Fit 头 - 元数据 Fit 文件中包含的元数据 –FITS 和 VOTable 具有一定的结构化 特征 – 比如 FITS 文件中会出现以 ASCII 编码的用于描述图像位 置信息等的部分 – 在天文学领域,元数据是用于描述档案、档案提供的 服务、其中的数据集合、每个数据集合的结构和语义 以及数据集合中每个数据集的结构和语义。 元数据包含了一些重要描述信息 – 典型的元数据可以是用来描述星表、图像或光谱等数 据对象的信息 – 包括天文学家在检索和筛选数据文件时所需要的判断 依据,如坐标信息等; – 同时还有一些可以作为简单数据处理所使用的输入信 息

Fits 头元数据示例

FitHAS 需求 已初步积累数据 –China-VO 通过多年的天文观测以及与其他国家的交流,已 获得大量的天文数据,并且数据的总量还将随着各巡天项目 不断的数据产出而增长 需要整理和归档 – 为 China-VO 的海量天文数据管理的规划和决策提供理论依 据,并为进一步发布天文数据和开发数据访问服务打下良好 的基础 自动化工具支持 – 开发通用天文数据的归档和管理工具,以解决目前 China- VO 面临的海量数据归档和管理中遇到的问题,并为未来大 天区多目标光纤光谱望远镜( LAMOST )等项目的数据管理 提供有效易用的工具,提高我国天文研究工作的效率和技术 水平。

FitHAS 意义 必要性 – 改变靠遍历访问大量的数据文件的做法 可行性 –FITS 有标准的格式约定,并且其头部记录部分采用 ASCII 格式编写, 因此可以方便地提取,也十分适于在数据库中进行灵活的查询 经济性: –FITS 头元数据占用空间较小。 – 以天文台已归档的部分 SDSS 的光谱数据为例, 1T 的 FITS 文件,存 入数据库的元数据所占用的空间仅几百 M 易用性 – 数据库 SQL 语句和结构查询方法,满足用户在海量数据的检索结 果和检索时间上的要求。 关联性 – 在入库的元数据中,还可以扩充其他重要信息,例如文件的位置, 这样就构成了元数据和对应文件之间的一一映射

e-Science 虚拟实验室的重要工具 LAMOST 数据归档 数据中心天文数据归档 e-Science 天文协同环境的第一步 FitHAS LAMOST 数据处理 系统 LAMOST 数据分析 系统 China- VO 天文 e- Science 虚拟 实验室

FitHAS 体系结构

FitHAS 主要功能 FITS 头部浏览 数据库元数据表的浏览 单一 FITS 文件的归档处理向导 FITS 文件的批量归档管理向导

FitHAS Feature FITS 头部解析和浏览 FITS 元数据和数据库中表模式的自动映射 存储 FITS 元数据的数据库表模式自动生成 单一 FITS 文件的入库归档 FITS 文件批量入库归档 数据库中元数据表的浏览 数据管理的可视化界面和完整归档管理流程 的用户向导 归档文件的过滤器筛选

FitHAS Feature ( 续 ) 元数据记录的冲突检测与处理 – 跳过冲突记录,其他照常导入 – 更新原有记录,其他照常导入 – 全部清空再导入记录 国际化支持 文件归档参数设置 数据库统一配置

FitHAS 目标 屏蔽不同 FITS 文件的差异 向用户提供统一的接口 对大量的 FITS 文件进行快速有效的访问和 方便的管理 有效满足 China-VO 对于海量数据存储和访 问的需求,同时具有很强的可扩展性

FitHAS 示例 - 主界面

FitHAS 示例 - 数据库配置

FitHAS 示例 - 数据浏览

FitHAS 示例 - 数据导入

FitHAS 导入效率

总结 FitHAS 有效解决 China-VO 所面临的从海量 数据中构造元数据层的难题 FitHAS 是实现天文 e-Science 协同环境的第 一步

下一步工作 年底 FitHAS 2.0 正式发布 FitHAS 2.0 开发 –Grid Service 接口 – 命令行接口 – 完整性检验 – 文档压缩

致谢 FitHAS 1.2 是由天津大学和国家天文台共同 完成开发 FitHAS 2.0 是在 1.2 基础上的进一步开发

谢谢!