第10章 典型中外文事实 数据库的利用 《现代信息查询与利用》课程组
问题引入 你知道人均收入是多少吗? 你知道人均收入是多少吗?
10.1 数据事实工具类型 10.2 典型事实数据库 10.3 其他事实数据库
数据事实工具 事实数据工具提供某方面的特定的经过集成加工的知识或知识和文献的线索, 专供查考疑难字词、重要人物、国内外大事、科技名词术语、具体统计数据、行业专业发展状况等问题
数据事实工具 常见的包括: 字词典、百科全书、年鉴、手册、名录、图表谱、类书政书等 印本事实数据工具又称为参考工具书,光盘与网络版的事实数据工具为多种事实数据库。
数据事实工具:形式 事实数据库(factual databases) 指包含大量数据、事实的数据库,分为数值数据库(Numeric databases)、图像数据库(Graphic databases)、术语数据库(Terminological databases)和指南数据库等,
10.1.1数据事实工具:字典、词典 字典,英文为Dictionary、lexicon,是汇集词语,解释概念、词义和用法,并按一定方式编排,供查检的参考工具。词典通常按字顺或音序编排。 按其用途分,可分为语言词典、专科性词典、综合性词典三类。
汉典http://www.zdic.net/
网络版的字词典 百度词典搜索 google语言工具 金桥翻译中心 OneLook Dictionaries Oxford English Dictionary 剑桥在线词典
百度词典搜索
10.1.2 数据事实工具:百科全书 百科全书(Encyclopedia )一词源于希腊语enkyklios和paideia,enkyklios 意为“循环的,周期性,平常的”,而paideia 则指“教育” 收录范围: 一类综合性的百科全书,包含了多个学科和领域的知识; 一类是专科性百科全书,只涉列某个学科或领域的知识。
信息量多少 小百科全书(一般在20卷以下) 大百科全书(20卷以上者)。
开放式百科全书 维基百科(Wikipedia) 维基百科于2001年1月15日成立,是第一个使用Wiki系统进行百科全书编撰工作的协作计划,是一个自由、免费、内容开放的百科全书协作计划,文本内容遵循GNU自由文档协议 中文维基百科于2002年10月24日正式成立
维基百科示例
互动百科 http://www.hudong.com/ 是全球最大的中文百科网站,致力于为上亿中文用户免费提供海量、全面、及时更新的百科信息,并通过全新的维基平台不断改善用户对信息的创作、获取和共享方式。
互动百科 http://www.hudong.com/
互动百科 手机版-使用方法 打开手机浏览器,输入地址“wap.hudong.com”,点击“确定”即可访问。也可以在电脑上安装Oprea等浏览器,访问该网址。 国内第一款手机百科搜索平台。
百度百科 是一部内容开放、自由的网络百科全书,旨在创造一个涵盖所有领域知识、服务所有互联网用户的中文知识性百科全书。 百度百科与百度贴吧、百度知道三位一体的服务,共同构筑了一个完整的知识搜索体系,成为网页搜索的有益补充,可以更好地提升用户的搜索体验。
百度百科 http://baike.baidu.com/
百度百科示例
10.1.3数据事实工具:年鉴 年鉴(Almanac,Annual,Yearbook),又称年报、年刊,按年度每年一期连续出版的资料性工具。 取材于当年政府公报和文件,以及国家重要报刊的报导和统计资料,汇集了一年内的社会科学和自然科学等领域的重大事件,重要时事文献、科学技术的新进展和统计数据,并附有大量图表和插图等,它们资料新颖、全面、具有权威性。 年鉴的新颖与综合性正好可以作为出版周期较长的大百科全书的一种补充。
10.1.4 数据事实工具:手册 是围绕某一课题或学科的各种事实和数据、统计 数字、规则、技术参数、图表、符号公式、原理 方法等各类资料汇集成册的出版物。
英文“Handbook”和“Manuals”两类。 handbook是指集中某一中心主题或某一专科的基本资料和数据的工具书,侧重“何物”(what); manual则是指导读者如何去做某件事(how-to-do)的操作型工具书。 名为“指南”、“大全”、“总览”、“要览”等的均属于手册类工具书。 按所收录的学科范围,可以分为综合性和专业性两种。
10.1.5 数据事实工具:名录 名录(Directory)是获取关于个人或机构基本状况信息的工具,包括人名录、地名录、机构名录、产品名录等。 人名录(Who's Who)是关于某些知名人物的姓名和简传的汇集。 机构名录(Dictionary,Directory)为查找不同范围的组织机构名称及其概况提供方便快捷的手段,
收录机构的沿革、地址、组织概况、成员情况等。 名录有印本、光盘和网络三种版本 查考某个著名人物、机构经历、成就的专门的工具,系统、实用。
10.1.6 数据事实工具:图录 图录是通过若干图象汇集起来并配有一定文字说 明来反映事物特征和发展情况的工具,直观、形 象 10.1.6 数据事实工具:图录 图录是通过若干图象汇集起来并配有一定文字说 明来反映事物特征和发展情况的工具,直观、形 象 包括地图、历史图谱、文物图录、人物图录、艺 术图录、科技图录谱等。 图录又有“图册”、“图谱”、“图集”、“图 鉴”等称谓
网上的图录资源 图行天下 http://www.go2map.com/,包含亚洲,非洲,大洋洲, 欧洲,北美洲,南美洲等国家或地区的电子地图。
网上的图录资源 城市框架电子地图 城市数字地图
10.1.7 数据事实工具:表谱 Tables,表谱包括年表、历表和其它专门性表谱。 10.1.7 数据事实工具:表谱 Tables,表谱包括年表、历表和其它专门性表谱。 年表按照重要的历史事件发生年代的顺序编纂成表,又称 “大事表”,有纪元年表和纪事年表两类。 历表是用来换算不同历法的年月日的工具。历表一般分旧 历表和新历表。
专门性表谱,以时间为线索揭示事物发展的 辅助性历史科学工具,如《中国历史人物生 卒表》、《慈嬉年谱》等 现在在大型光盘和网络参考工具数据库中多 嵌入表谱工具辅助检索 ,也有一些独立的网上 表谱资源,如家谱类网站
网上表谱资源 中国历代帝王年表(http:∥www.mypcera.com/ book/li/002.Htm) 中国历代年号索引表(http:∥www. mypcera.com/ book/li/1/003.Htm)
网上表谱资源 毛主席 :毛泽东网上纪念 馆,包括纪念文选、 历史相册、人物讨论、 活动年谱、相关链接。 http://cn.netor.com/m /box200104/m5221. asp?BoardID=5221 , 网上表谱资源
10.2 事实数据库 事实数据库(factual databases),指包含大量数据、事实的数据库,分为数值数据库、指南数据库、术语数据库等,相当于印刷型文献中的字典、辞典、手册、年鉴、百科全书、组织机构指南、人名录、公式与数表、图册(集)等。
10.2 事实数据库 主要类型: 包括电子化字(词)典、辞典、数值、公式、数表与表册数据库、图像、图录数据库、电子百科全书、电子手册及专业手册数据库、组织机构指南、传记资料、年鉴、统计资料数据库等
10.2 事实数据库 字词典、百科全书、名录、年鉴、手册、图录对应库 中文 综合性:中国资讯行、万方数据库系统、中国经济信息网、新华社多媒体数据库 专科性:中国城市规化建设数据库、中国宏观经济数据库、中国科学院科学数据库等。
10.2 事实数据库 字词典、百科全书、名录、年鉴、手册、图录对应库 外文 综合性:GaleNet、LEXIS-NEXIS 专科性:Beilstein/Gmelin Crossfire化学资料数据库、ISI Chemistry化学数据库和Genome Database数据等。
10.2 事实数据库 10.2.1 国研网 国务院发展研究中心信息网(简称“国研网”)是我国著名的专业性经济信息服务平台,1998年3月创建。 在国内外宏观环境、经济金融运行特征、发展趋势及政策走向上提供有价值的参考。 内容丰富、检索便捷、功能齐全的大型经济信息数据库集群
10.2 事实数据库 数据库的检索功能 (1)分类浏览 (2)快速检索 (3)高级检索 (4)数据检索
10.2 事实数据库 (1)分类浏览 国研网是一个门户型的经济网站,把最热门的或最早的信息放在首页,供用户快速浏览。 用户可选择菜单栏项目或右上角的“网站地图”浏览各类别。
10.2 事实数据库 国研网首页
10.2 事实数据库 (2)快速检索 在国研网首页的搜索框中输入一个或多个检索词进行搜索即可。 多个检索词之间可用布尔逻辑运算符,以获得更为准确的搜索结果。 逻辑与:空格、+、& 逻辑或:| 逻辑非:- 通配符 !表示0或1个任意字符 ?表示1个任意字符
检索中心 选择查询内容所在的版本,以提高查准率,节省处理结果的时间。 根据需要选择检索字段。
10.2 事实数据库 (3)高级检索
10.2 事实数据库 (4)数据检索 数据检索是国研网统计数据库提供的检索入口,包括20多个数据库,数据内容覆盖国民经济各个方面。 在国研网首页选择“国研网统计数据库”即可进入数据检索。
10.2 事实数据库 (4)数据检索 每个数据库都有数据库介绍、解释说明、使用帮助。 结果数据界面除了有数据全文、数据图表,有些库还可以对表格进行转换行列、导出数据、显示图形等操作。
全文界面 在文章中, 国研网数据 中心将全国 居民消费价 格水平情况 绘制成图表。 用户获取系 列数据更方 便。
10.2.2 Encyclopedia Britannica Online 10.2 事实数据库 10.2.2 Encyclopedia Britannica Online 1、 Encyclopedia Britannica Online平台介绍 2、 Encyclopedia Britannica Online检索功能 3、检索实例
1、 Encyclopedia Britannica Online平台介绍 10.2 事实数据库 1、 Encyclopedia Britannica Online平台介绍 大不列颠百科(Encyclopedia Britannica)全书俗称大英百科全书,为英语普通全书中历史最长和篇幅最大的百科全书,于1768年首次出版发行。不列颠百科全书的条目均由世界著名学者、各个领域的专家撰写,其学术性和权威性为世界所公认。其网络版 Encyclopedia Britannica Online(简称EB Online)于 1994 年正式上网。
1、 Encyclopedia Britannica Online平台介绍 10.2 事实数据库 1、 Encyclopedia Britannica Online平台介绍 EB Online内容主要包括: 大事年表(Timelines) -依照时间序列呈现所选主题的大事纪录,共包括14种主题类别:建筑、艺术、儿童时期、每日生活、生态学、探险、文学、医学、音乐、宗教、科学、运动、科技、女性历史。 全球资料分析(World Data Analyst) -提供所选国家的简介及各类统计资料,例如地理状况、人口分析、官方语言、教育程度、政经情势、贸易类型、军队、交通、通讯等。
10.2 事实数据库 国家比较(Compare Countries) -提供超过215个国家的基本地理人口资料、地图、国旗、各类统计、相关文章、相关影像、多媒体数据、最近发生事件、与相关网站资源等。 世界地图(World Atlas) -与Google map合作,提供使用者世界各国人文、地理等概况。 名人格言(Notable Quotation) -提供古今中外4000多篇名人格言。
1、 Encyclopedia Britannica Online平台介绍 10.2 事实数据库 1、 Encyclopedia Britannica Online平台介绍 大英主题数据库(Spotlights) -提供更深入且丰富的主题研究,从远古时代的恐龙、诺曼底登陆、铁达尼号、到奥斯卡、美国总统全集共20种主题深度探讨。 各式浏览方式 -索引、A-Z字母、主题、年鉴、贡献者。
10.2 事实数据库 个人知识档案夹(Workspace) -提供每位读者建立个人的知识档案夹 大英知识部落格(Britannica Blog) -大英知识部落格是专为喜爱知识的朋友们所建立的知识智能、互动分享空间。 动物拥护站(Advocacy for Animals) -动物拥护站替读者开启一扇通往动物世界的大门。以爱护动物、关怀动物为出发点 ,展开多面向的议题探讨。
Encyclopedia Britannica Online首页 不熟悉EBOL使用的人可以借助Help来在线学习 利用workspaces可以方便的将自己喜欢的文章保存下来 浏览 返回主页 动物拥护站 博客
Encyclopedia Britannica Online首页 10.2 事实数据库 Encyclopedia Britannica Online首页 高级检索 选定的新修订条款 浏览检索,可以按照编者,也可以按主题,或者以A-Z为标题的文章快速检索出来。 标准检索 马利安—韦伯斯特大学词典和词库
Encyclopedia Britannica Online首页 研究工具主要包括 Timelines 时间序列主题 World Data Analyst世界各国数据浏览 Compare Countries 国家概况比较 World Atlas 世界地图集 This Day in History 历史上的今天 新闻连结
Encyclopedia Britannica Online首页 10.2 事实数据库 Encyclopedia Britannica Online首页 不列颠精选主题浏览,提供更深入且丰富的主题研究数据库,包含由不列颠编辑群精心制作的20个专题数据库,如莎士比亚、诺曼底登陆、泰坦尼克号、美国总统等
2 、 Encyclopedia Britannica Online 平台的检索功能 10.2 事实数据库 2 、 Encyclopedia Britannica Online 平台的检索功能 标准检索 高级检索
10.2 事实数据库 高级检索
10.3 其他事实数据库 10.3.1 中国咨询行 10.3.2 万方数据库 10.3.3 GaleNet 10.3.4 Beilstein/Gmelin Crossfire 10.3.5 ISI Chemistry和Genome Database
10.3 其他事实数据库 10.3.1 中国资讯行 Infobank于1995年在香港成立,是一家专门收集、处理及传播中国商业、经济信息的高科技企业,目前由北京精讯公司管理。经过十余年的数据积累,Infobank数据库已经拥有逾150亿汉字的信息储备,信息范围涵盖19个领域、194个行业。Infobank通过网络、光盘、纸版等多种媒体向全球客户提供信息服务,成为目前全球最大的中文信息提供商之一。
10.3 其他事实数据库 10.3.1中国资讯行 该数据库较为适合经济、工商管理、财经、金融、法律、政治等专业使用,尤其是其包含有各类报告、统计数据、法律法规、动态信息等内容。目前有14个大型专业数据库,数据库容量逾150亿汉字。采用每日新增的方法,日新增数据量逾2000万汉字
10.3 其他事实数据库 包括哪些特色数据库? 专业检索数据库: 其他参考数据库: 中国经济新闻库 香港上市公司资料库 中国法律法规库 中国企业产品库 中国统计数据库 中国人物库 中国上市公司文献库 中国中央及地方政府机构库 中国商业报告库 English Publication 中国医疗健康库 名词解释库 INFOBANK环球商讯库 中国拟建在建项目数据库库
收录了经济学家关于中国宏观经济、中国金融、中国市场及中国各个行业的评论文章和研究文献,以及政府的各项年度报告全文。为您提供专业的研究资料 10.3 其他事实数据库 包括哪些特色数据库? 中国医疗健康库 收录时间:1995年——至今 收录了中国一百多种专业和普及性医药报刊的资料,向用户提供中国医疗科研、新医药、专业医院、知名医生、病理健康资讯 English Publication 收录了部分英文报刊的全文数据及新华社英文实时新闻资料 中国上市公司文献库 收录时间:1993年——至今 收录了在沪、深交易所上市公司(包括A股、B股及H股)的资料,网罗深圳和上海证券市场的上市公司各类招股书、上市公告、中期报告、年终报告、重要决议等文献资料 中国企业产品库 中国27万余家各行业企业基本情况及产品资料。文献分为十三个大类 中国法律法规库 收录时间:1903年—至今 收录以中国法律法规文献为主,兼收其他国家法律法规文献。收录自1949年以来中华人民共和国中央及地方的法律法规,以及各行业有关条例和案例。为您提供最及时的法律参考 中国中央及地方政府机构库 中央国务院部委机构及地方政府各部门资料,包括各机构的负责人、机构职能、地址、电话等主要资料 中国人物库 中国一百多种专业和普及性医药报刊的资料,向用户提供中国医疗科研、新医药、专业医院、知名医生、病理健康资讯 名词解释库 有关中国大陆所使用的经济、金融、科技等行业的名词解释,以帮助海外用户更好地了解文献中上述行业名词的准确定义 中国商业报告库 收录时间:1993年—至今 收录了经济学家关于中国宏观经济、中国金融、中国市场及中国各个行业的评论文章和研究文献,以及政府的各项年度报告全文。为您提供专业的研究资料 香港上市公司资料库 香港1000多家上市公司1999年以来公开披露的各类公告及业绩简述。可按公司代码、行业分类、公告类型进行分类检索,为用户提供了一个全面了解香港上市公司动态的有效途径 中国统计数据库 收录时间:1986年——至今 收录国家及各省市地方统计机构的统计年鉴、海关统计、经济统计快报等月度及季度统计,其统计数据可追溯到1949年,亦包括海外地区统计数据。数据按行业及地域分类 中国拟建在建项目数据库 收集经国家计委、国家经贸委以及地方计(经)委批准建设的各行业投资总额在人民币1000万元以上的各行业拟建和部分在建项目的详细资料,包括项目概况、项目规模、主要投资者简介、所需关键设备、负责人简历及联系方式等。 行业的范围覆盖全国交通、能源、电信、市政、环保、原材料加工、石油、化工、医药、机械、电子、农林水利和旅游开发等领域。 INFOBANK环球商讯库 自1998年以来实时播发的“环球商讯”的全部新闻文献 中国经济新闻库 收录时间:1992年——至今 收录了中国地区及海外商业财经信息,以媒体报道为主。数据来源于中国千余种报刊及部分合作伙伴提供的专业信息, 内容按197个行业及中国各省市地区分类
中国资讯行主界面 可供选择的数据库 点击浏览检索热点行业动态 其他产品 选择逻辑关系,三种逻辑关系分别对应逻辑与、或、非 提供14个在线数据库 选择检索范围:标题或者全部 可供选择的数据库 点击浏览检索热点行业动态 选择时间:前一周、前一月、前一年、前三月、全部数据 其他产品
10.3 其他事实数据库 中国资讯行检索 1、简单检索 2、专业检索 3、子库功能示例
10.3 其他事实数据库 1.简单检索 步骤: *确定检索关键词 **选择数据库 ***选择逻辑关系/时间/检索范围 ****检索 *****在检索结果中二次检索
For example: 想了解: 2012年2-4月 北京市房屋价格如何? 10.3 其他事实数据库 1.简单检索 选择经济新闻数据数据库 时间限定在前三月 For example: 想了解: 2012年2-4月 北京市房屋价格如何? 输入检索词:杭州 房价 点击“检索” 点击文章标题看全文
10.3 其他事实数据库 2.专业检索 步骤: 1)进入专业检索界面 2)选择相关数据: 行业分类 地区分类 文献出处 检索范围 逻辑关系 返回记录
10.3 其他事实数据库 2.专业检索 选择相关数据 点击,进入数据库
10.3 其他事实数据库 3、子库功能示例 例子:查找2011年中国宏观经济指标统计 数据库:中国统计数据库 行业:宏观综合类 地域:中国 参考资料:全部 输入关键词:宏观经济 时间:20110101-20111231
首先在主界面中选择点击选择包含统计数据的“中国统计数据库” 10.3 其他事实数据库 3、子库功能示例 首先在主界面中选择点击选择包含统计数据的“中国统计数据库”
关键词栏输入“宏观经济”并限定在“指标参数”中查找,地区选“中国”,行业选“宏观综合类”,时间从“201101-2012” 10.3 其他事实数据库 3、子库功能示例 进入专业检索界面, 关键词栏输入“宏观经济”并限定在“指标参数”中查找,地区选“中国”,行业选“宏观综合类”,时间从“201101-2012” 点击,进行检索
10.3 其他事实数据库 10.3.2 万方数据库系统 万方数据库(http://new.wanfangdata.com.cn/)提供的上百个子 数据库, 还包括台湾中医药纪事、台湾名人库、台湾中医师名录、台湾医 疗机构、台湾企业名录等10多个台湾名录型系列库; 寻医问药Ⅰ、寻医问药Ⅱ、北京机构、北京交通、北京旅馆、北 京旅游、英汉—汉英词库等8个百科信息数据库 中国科技名人、中国科研机构、科技信息机构、中国高等院校等4 个名人和机构库,是国内目前提供中文数据事实数据库最多的系 统
10.3 其他事实数据库 10.3.3 GaleNet GaleNet(http://galenet.galegroup.com)是美国Gale 出版集团提供的、汇集了多个参考资料库的网络系统。覆 盖人文社会科学、商业经济、国际市场、人物传记、机构 名录等范畴,
10.3 其他事实数据库 10.3.3 GaleNet GaleNet,包括: ① 社团大全(Associations Unlimited):包括了大约455,000个国际性及美国 IRS(Internal Revenue Service)认可的非盈利性成员机构的名录资料和2,600个主要的美国全国性协会机构。 ② 传记资源中心(Biography Resource Center):包括185,000个人物的古今中外名人传记资料,收录完整的Marquis Who‘s Who 逾百万位人物传记资料,同时也收录了近250种期刊的全文。
10.3 其他事实数据库 10.3.3 GaleNet ③ 盖尔商业资源(Gale Business Resources):包括448,000个美国及国际性企业、公司的详细信息,还包括有关1,000个美国及全球主导企业的研究报告、排名信息、市场份额、商业协会和统计分析的资料。 ④盖尔常备参考书书架(Gale‘s Ready Reference Shelf):收录了14种盖尔最受欢迎的参考性字典。
10.3.4 Beilstein/Gmelin Crossfire 10.3 其他事实数据库 10.3.4 Beilstein/Gmelin Crossfire Beilstein/Gmelin Crossfire化学资料数据库由Elsevier公 司出版发行,是当今世界上最庞大和享有盛誉的化合物数 值与事实数据库
10.3.4 Beilstein/Gmelin Crossfire 10.3 其他事实数据库 10.3.4 Beilstein/Gmelin Crossfire 包括两套数据库,其中Beilstein收集有机化合物的资料, Gmelin 收集有机金属与无机化合物的资料,分别对应印刷本 的Beilstein Handbuch der Organische Chemie和Gmelin Handbook of Inorganic and Organometallic Chemistry, 这两部工具书有一百多年的历史,是化学、化工领域最重要的 参考工具。 多途径检索的方式,可用化合物的全结构或部份结构进行检索, 可以文字或数值进行分子性质检索,功能强大。
10.3.5 ISI Chemistry和Genome Database 10.3 其他事实数据库 10.3.5 ISI Chemistry和Genome Database ISI Chemistry(http://chemserver.com)由美国科技信 息所(ISI)推出,提供学术期刊和专利文献中所报道的最 新化学合成、材料合成、药物合成和化合物结构及其生物 活性方面的信息,是目前唯一基于Web展开化学结构及反 应检索的大型化学信息数据库。 包括“反应中心”(1986—2001年以来化学反应信息)和 “化合物中心”(1996—2001年)两大数据库。
10.3.5 ISI Chemistry和Genome Database 10.3 其他事实数据库 10.3.5 ISI Chemistry和Genome Database 化学反应资料中心覆盖广泛的化学期刊和专利文献 , 包括详细的反应资料,提供化学反应细节。 化合物资料中心包括100多万个化合物数据,也包括合 成中间体和同位素标记化合物。