第3章 信息资源的分布 江西财经大学信息管理学院 沈波.

Slides:



Advertisements
Similar presentations
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
Advertisements

Chapter 3: SQL.
信号与系统 第三章 傅里叶变换 东北大学 2017/2/27.
联系电话: 联 系 人:李爱玲 中国人文社会科学文献(CASHL)传递 联系电话: 联 系 人:李爱玲
3.4 空间直线的方程.
——Windows98与Office2000(第二版) 林卓然编著 中山大学出版社
计算机网络课程总结 一、计算机网络基础 计算机网络定义和功能、基本组成 OSI/RM参考模型(各层的功能,相关概念, 模型中数据传输 等)
LSF系统介绍 张焕杰 中国科学技术大学网络信息中心
《解析几何》 乐山师范学院 0 引言 §1 二次曲线与直线的相关位置.
随身携带的图书馆 ——移动图书馆服务介绍 主讲人:陈洋阳.
人大复印资料全文数据库 人大复印资料全文数据库选辑1995年至今公开发表的人文科学和社会科学中各学科、专业的重要论文和重要动态资料的全部原文。其信息资源覆盖了人文科学和社会科学领域国内公开出版的3000多种核心期刊、专业期刊和报纸,分4大类100多个专题。
如何获取 全球各学科高引频著者信息.
姓 名 出生年月 所在学科 最高学历/位 专业 毕业学校 成果内容 本人业绩 (一)教学内容
第三章 数据类型和数据操作 对海量数据进行有效的处理、存储和管理 3.1 数据类型 数据源 数据量 数据结构
中国债券信息网中文版改造 设计思路 二00七年十月十日.
素材 资源 库 文字 图形 图像 声音 动画 视频 人力 物力 财力 获取素材的渠道 数据库.
第七章 现代教育技术的应用 第一节 现代教育技术与生物学教育 第二节 计算机及其相关技术在生物学 第三节 互联网在生物学教学中的应用
2.3 网络域名及其管理.
UI(用户界面)集训班 Illustrator 高级班.
通货紧缩 唐山工业职业技术学院 管理工程系 李文鹏
第四次大作业 登陆学校图书馆网站的电子数据库
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
中青国信科技(北京)有限公司 空间域名邮局价格表.
C++中的声音处理 在传统Turbo C环境中,如果想用C语言控制电脑发声,可以用Sound函数。在VC6.6环境中如果想控制电脑发声则采用Beep函数。原型为: Beep(频率,持续时间) , 单位毫秒 暂停程序执行使用Sleep函数 Sleep(持续时间), 单位毫秒 引用这两个函数时,必须包含头文件
                                                                                                                                                                
百链 1.
有机所文献利用快速指南 平台入口: 图书馆网站 文献、数据检索:
如何使用CiteSpace分析Derwent专利数据
LSF系统介绍 张焕杰 中国科学技术大学网络信息中心
R in Enterprise Environment 企业环境中的R
中国科学技术大学 肖 明 军 《网络信息安全》 中国科学技术大学 肖 明 军
存储系统.
李杰 首都经济贸易大学 安全与环境工程学院 个人主页:
大学计算机基础 典型案例之一 构建FPT服务器.
SQL Injection.
全国高校数学微课程教学设计竞赛 知识点名称: 导数的定义.
第11章:一些著名开源软件介绍 第12章:服务安装和配置 本章教学目标: 了解当前一些应用最广泛的开源软件项目 搭建一个网站服务器
第一单元 初识C程序与C程序开发平台搭建 ---观其大略
Windows网络操作系统管理 ——Windows Server 2008 R2.
数据库检索指南 SpringerLink全文电子期刊.
B R _ Computer-related vocabulary 1
第17章 网站发布.
1085至1125年间的官员地域分布与社会关系 1.
双曲线的简单几何性质 杏坛中学 高二数学备课组.
第3章 信息与信息系统 陈恭和.
若2002年我国国民生产总值为 亿元,如果 ,那么经过多少年国民生产总值 每年平均增长 是2002年时的2倍? 解:设经过 年国民生产总值为2002年时的2倍, 根据题意有 , 即.
NoteExpress进阶 宋敏 电子资源部
第一章 函数与极限.
電子郵件簡介.
2019/4/16 关注NE官方微信,获取更多服务.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
数据库使用指南 Nature全文数据库.
用计算器开方.
计算机网络与网页制作 Chapter 07:Dreamweaver CS5入门
第4章 Excel电子表格制作软件 4.4 函数(一).
北京中科进出口有限责任公司 PQDT论文全文库检索平台.
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
SIAM全文电子期刊数据库国际站使用指南
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
深 圳 职 业 技 术 学 院 SHENZHEN POLYTECHNIC
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
SIAM全文电子期刊数据库国际站使用指南
Ecological Society of America(ESA)
基于列存储的RDF数据管理 朱敏
FH实验中电子能量分布的测定 乐永康,陈亮 2008年10月7日.
FVX1100介绍 法视特(上海)图像科技有限公司 施 俊.
入侵检测技术 大连理工大学软件学院 毕玲.
2019/9/19 互联网产业、立法与网规 张钦坤 腾讯法务部.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Presentation transcript:

第3章 信息资源的分布 江西财经大学信息管理学院 沈波

信息资源分布 信息资源分布的研究---有利于信息资源开发、管理和利用。 信息生产的多目的性和无序性---信息资源分布复杂 本文突出文献信息资源的分布 信息计量学: http://baike.baidu.com/view/616809.htm 网络信息计量学: http://baike.baidu.com/view/292825.htm?fr=ala0_1

信息资源分布的特征 马太效应----信息富集现象 核心趋势和集中取向 利:降低成本,提高利用率 弊:富集的表面想象、忽略了新信息及新信息新生产者

信息的时间分布变化规律 D.普赖斯先生1922年生于英国伦敦。1946年在伦敦大学获物理学博士学位,1954年又在剑桥在学获得科学史博士学位。1960年到1983年去世前一直任美国耶鲁大学科学史与医学史系教授。并长期担任系主任。是美国第一位阿瓦隆基金科学史教授。去世前当选为瑞典皇家科学院外籍院士。曾获达.芬奇奖章、贝尔纳奖、萨顿纪念奖。国际《科学计量学》杂志和美国科学史学会都设有D.普赖斯奖。

1966年是洛特卡定律发表70周年。文献计量学的诞生是以1926年洛特卡定律的发表为标志的,它在情报学三大非指数型定律中具有学术领先的地位。70年前,美国情报学家洛特卡通过大量调查统计,发表了题为《科学生产率的频率分布》的论文,指出了科学领域里论文的作者频率与论文数量之间存在的规律。这一研究成果在图书情报界产生了深刻的影响,被后人称为“洛特卡定律”。 洛特卡定律的作用在于揭示著者与其论文间的数量关系,描述科学生产率。这里的科学生产率是指科学工作者在给定时间内发表的论著数量。

信息的时间分布变化规律 英国情报学家普赖斯1950年首次发表了有关“指数增长”的研究论文。1961年在《巴比伦以来的科学》中,总结出科学期刊指数增长的规律,给出了著名的普赖斯指数增长曲线和曲线方程: 1. 普赖斯指数增长规律 1944年美国图书馆学家赖德发现了图书馆藏书量平均每16年增加一倍,已经道出了指数增长规律的实际内容,但没有用数学语言来充分描述它,更没从理论上指出其普遍性。 式中:F(t)是文献累积量;t是时间(年);a是初始时刻(t=0)的文献累积量;b是文献的持续增长率,其值近似等于文献的年增长率。

普赖斯指数增长规律经雷歇、纳里莫夫、弗拉杜奇等人的研究和扩展,如今更常用的文献增长曲线是逻辑增长曲线,其表达式为: 式中:F(t)为t年的文献累积量,k,a,b都是大于0的常数。

2. 巴尔顿-凯普勒老化方程 最早用半衰期来描述文献老化问题的是美国学者贝尔纳,但对文献老化进行定量研究的则是美国人巴尔顿(R.E.Barton)和凯普勒(R.Kebler),1960年联名发表了题为《一些科技文献的“半衰期”》的论文。 巴尔顿-凯普勒方程修正式: 衡量信息资源老化有两个重要的测试指标:半衰期和普赖斯指数,其中以半衰期最为常用。 所谓文献的“半衰期”,是指某学科(专业)现时尚在利用的全部文献中较新的一半是在多长一段时间内发表的;这与该学科一半文献失效所经历的时间大体相当。

目前,描述文献老化规律的数学表达式一般采用如下负指数函数形式: 式中:C(t)为对发表了t年的文献的引用频次;k为常数,随学科不同而异;e为自然对数的底;a 为老化率。 式中:a+b=1;y为某学科现时尚在被利用的文献的累积相对比(y<1);x为过去时间,以10年为单位。当y=0.5时,就可以计算出文献的半衰期。

信息资源空间的分布特征 信息扩散的多向对称性 信息传递的密度递减法则

信息资源的分布规律

1. 布拉德福定律 布拉德福定律的数学表达式: R(n)=a·nβ (1≤n≤c) R(n)=Klgn/s (c≤n≤N) 式中:R(n)为对应于n的相关论文的累积数;n为期刊等级排列的序号;a为第1级期刊中相关论文量R(1);c为核心区的期刊数,即由曲线过渡到直线交点对应的n值;N为等级排列的期刊总数;β为参数,它与核心区的期刊数量有关,大小等于曲线的曲率,并且小于1;K为系数,等于分散曲线中直线部分的曲率;S为参数,其数值等于图形直线部分向横坐标延伸并与其相交点的n值。 在某一时间范围内,如果将科学期刊按其刊载某学科领域文献的数量,从小到大递减排序,然后将其分成3个区,每个区依次称为核心区、相关区和外围区,使每个区刊载该领域文献总量相等,那么3个区的期刊数量成1:a:a2关系。这就是布拉德福定律(Bradfod’s Law,简称布氏定律)的原型。就布拉德福分析的数据来说,常数a的值约为5。

2. 文献信息资源的集中与分散 科学技术的发展、学术论文的发表造就了核心期刊和非核心期刊,同时也造就了核心文献信息资源和非核心文献信息资源。只要我们在某一时间范围内将使用者所需要的文献信息资源按需求量递减排序并分成若干区,就会发现,在每个区的文献需求总量相等的情况下,各区信息源中信息总量之比基本上呈1:a:a2 ……(a为常数)的趋势。

信息资源分布的格局 信息分布的主要机构 1、图书馆 2、情报中心 3、政府部分 4、企业

网络信息资源其他称谓 网络信息资源尚没有统一的定义 类似的名称很多,如: “因特网信息资源” “电子信息资源” “联机信息” “万维网资源” “数字信息资源”

网络信息资源定义 网络信息资源可以理解为通过计算机网络可以利用的各种信息资源的总和。 网络信息资源是从计算机技术、通信技术、多媒体技术相互融合而形成的网络上可查找的资源。  

网络信息资源类型 从内容上网络信息资源几乎涵盖了人类所有的重要活动 对网络信息资源进行了类型化和体系化研究,产生了不同的分类方案 目的是便于更好地认识、组织、检索、管理和利用。

网络信息资源的划分 ——按应用工具方式分 电子邮件 用户组 远程登录 文件传输 WWW Gopher WAIS

Web1.0

Web2.0 博客(BLOG) 播客 (PODCASTING) 书签(Tag) 真正简易聚合(RSS) 即时通讯(Instant Messenger,简称IM),典型代表为MSN和QQ。 社会性网络软件(Social Network Software,简称SNS) WIKI(维基)

Web3.0

网络信息资源的划分 ——按信息交流的方式 非正式出版信息。 半非正式出版物。 正式出版物。 因特网将多类型和多层次的信息是融为一体。 网络信息资源的划分 ——按信息交流的方式 非正式出版信息。 如电子邮件、专题讨论小组和论坛电子会议、电子布告板新闻等。 半非正式出版物。 从各种单位的网址或主页上, 可以查询正式出版物系统所无法得到的“灰色”信息。 正式出版物。 各种数据库联机杂志和电子杂志、电子版工具书、报纸、专利信息等。 因特网将多类型和多层次的信息是融为一体。

网络信息资源的划分 ——按网络信息资源的层次分 网络信息资源的划分 ——按网络信息资源的层次分 指示信息 即一个信息单元的地址。 信息单元 可以指示信息表达的最小信息单元。 信息集合 指相互关联的信息集合。是由若干相关信息及其中特定的信息单元和指示信息所组成的。 信息系统 指一组相关的、经过标引和建立了交互参见的信息资源的集合。

网络信息资源的划分 ——按信息资源的来源 政府 研究机构 事业单位 公司企业 社会团体 个人

网络信息资源的划分 ——按信息资源的内容主题 网络信息资源的划分 ——按信息资源的内容主题 政治性文件 学术研究报告 经济活动的信息 (广告、企业情况 ) 历史文献资料 教育 公共性(社区信息) 娱乐性

网络信息资源的划分 —从网络信息载体分 文本 图像 图形 动画 声音 视频 组合媒体

网络信息资源的特点 数量巨大 类型多样 变化频繁 结构复杂 传播快捷 共享性好 质量不一

数量巨大 网络信息量大,内容丰富。 网络信息增长较快。 随着计算机硬件、软件技术的不断发展,特别是海量存储等技术为大容量、高速度的网络服务器提供了条件; 计算机的信息处理能力不断增强,许多形式的信息都可以在网络中存储和传递。 可以肯定网络信息资源将进一步激增

中国互联网络信息资源数量调查

网络资源的地域分布

网络普及率与GDP关系

类型多样 内容包罗万象,覆盖了不同学科、不同领域、不同地域、不同语言的信息资源。 不仅有题录、摘要,而且还有不少全文。 载体包括文本、图像、声音等。 多媒体、多语种、多类型信息的混合体。 形式上既有公开出版、又有非公开发行的包括会议文献、学位论文、内部资料

最贵网页 http://www.milliondollarhomepage.com

变化频繁 网络信息资源是一个动态系统。 网络信息更新迅速,网页增加、删除、更换地址经常发生。 网络信息的资源时效性强。 网页更新周期缩短,有关的内容处于一种动态的变化之中。 在网上能得到最新的资料以及某个学科或某项科研的最新动态,能检索到最近出版的文献。

结构复杂 网络信息分别存储在不同国家、不同地区的服务器上。 对信息资源的组织管理没有统一标准,百花齐放 不同的服务器采用不同的操作系统及数据结构 从整体上来看,基本处在无序的状态。 不少的服务器还用中间件与其他数据库连接起来 在管理和利用方面比较复杂。 结构化数据 半结构化数据 非结构化数据

网络信息资源的结构 内容结构、表述结构、组织结构、分布结构和传播结构。 网络信息资源 来源广泛、结构多元、分布复杂 网络信息资源的结构可以分为: 内容结构、表述结构、组织结构、分布结构和传播结构。

用户差异大 网络用户类别多样; 用户群体也表现出多样性的特点; 各种用户之间的需求类型差异很大; 用户信息需求变化频率加快; 用户需求日趋向个性化、特殊化 部分用户需求更加趋向专门性。

传播快捷 互联网对社会热点事件的反应速度之快是前所未有的 网络越来越多地主导了舆论的方向。 网民们也乐于在互联网上发表自己对当前社会热点事件的见解。 几乎每一个社会热点出现,就会导致一个网络流行语的产生。

为什么“做俯卧撑”很快火了起来 “三个俯卧撑”之所以成为热点,贵州省省公安厅对“瓮安6.28严重打砸抢烧突发性事件新闻发布会”上的说明。 其中在说明“关于李树芬溺水死亡事件的事实”时,有这样的描述:“刘见李树芬心情平静下来,便开始在桥上做俯卧撑。当刘做到第三个俯卧撑的时候,听到李树芬大声说‘我走了’,便跳下河中……” 很快,描述的这一细节中的三个俯卧撑就成为互联网上网民关注的热点,在网民恶搞之下,“三个俯卧撑”很快火了起来。

满网尽是俯卧撑 2.如果我曾经看得远一点,是因为我比别人多做了三下俯卧撑。——牛顿 1. 给我做三下俯卧撑,我也能推动地球。——阿基米得  2.如果我曾经看得远一点,是因为我比别人多做了三下俯卧撑。——牛顿  3. 做俯卧撑时运动速度大小,取决于你选取的参照物。——爱因斯坦 4. 天才就是百分之九十九的汗水加上三个俯卧撑。——爱迪生    5.俯卧撑即合理。——黑格尔  6.做俯卧撑还是立卧撑,这是个问题。——哈姆雷特  7.俯卧撑尚未完成,同志们仍需努力。——孙中山  8.我撑故我在。——笛卡尔  9.俯卧撑已经做三下了,胜利还会远吗?——雪莱  10.世界上本来是没有路的,做俯卧撑的人多了,也就成了路。——鲁迅  11.做自己的俯卧撑,让别人说去吧!——但丁 

质量参差 网上信息发布具有很大的自由度和随意性 缺乏必要的过滤、质量控制和管理机制。 网络信息具有不同的层次与效用 良莠不齐 既有科学前沿研究报告,也有大众通俗读物;既有已经加工整理的信息,也有无序的原始信息;既有较大参考价值的信息,也可能混有毫无用处的“信息垃圾”,甚至还有不少有害的信息。 良莠不齐 有的可以带来极大的效益,有的可能会造成不良后果,利用的价值差异较大

假冒的中国银行网站

发送电子邮件,以虚假信息引诱用户中圈套。 建立假冒网站,欺骗真实网站的用户 “网络钓鱼”主要手法: 发送电子邮件,以虚假信息引诱用户中圈套。 建立假冒网站,欺骗真实网站的用户 例如:中国银行www.bank-of-china.com 假冒网址www.bank-off-china.com    农业银行www.95599.cn 假冒网址www.965555.com 工商银行www.icbc.com.cn 假冒网址www.1cbc.com.cn

利用虚假的电子商务进行诈骗 利用木马和黑客技术等手段窃取用户信息 例:“ 联想集团和腾讯公司联合赠送QQ币”的虚假消息 恶意网站:http://www.1enovo.com 联想网站:http://www.Lenovo.com,

网络信息污染 信息污染是指信息资源中混入了一些干扰性、欺骗性、有害信息的现象 影响了人们对有用信息的利用, 甚至造成对人类的危害。 网络环境下信息污染主要是指网络信息对用户造成不良的后果,或对正常的信息利用带来负面的影响。

网络信息污染的形式 冗余信息 失效信息 污秽信息 网络病毒 虚假信息 信息文化侵蚀