Download presentation
Presentation is loading. Please wait.
1
网络科技信息自动监测服务平台 张智雄,刘建华,钱力,谢靖 中国科学院国家科学图书馆 2013年9月10日
2
提纲 1.背景 2.问题和思路 3.系统和服务 4.效果
3
提纲 1.背景 2.问题和思路 3.系统和服务 4.效果
4
1.背景 特定领域的 科技动态 领域战略布局 领域当前的 重要问题 领域内战略规划 领域技术预见 主题的发展追踪 机构、领域间的 关联关系
机构、领域的 竞争力评估 机构、领域的动态 变化趋势 ..... 监测科技领域 变化,洞察科技 领域发展是文献 情报机构的重要 任务之一
5
1.背景 知识服务情报产品 常规情报快报、 专报产品 面向任务定制的情报分析析报告 各类指标 数据库 其它 网络开源 科技信息 专利引文
...... 常规情报快报、 专报产品 面向任务定制的情报分析析报告 先进能源 监测快报 科学战略 监测快报 地址灾害国际发展 态势分析 世界矿产资源流动格局 光电信息 简报 全球药物 创新快讯 ...... 学科政策动态研究 ...... 跟随科技专项项目的 情报服务 各类指标 数据库 其它 网络开源 科技信息 专利引文 数据库 全文、二次文 献数据库 国家科学图书馆领域情报团队 国家科学图书馆学科服务团队 中国科学院各研究所
6
1.基本情况介绍 通过网络发布的 开放网络科技 信息资源
7
1.背景 开源情报 Open-source intelligence, OSINT
致力于利用公开可以获取的,而不是隐蔽和秘密的信息资源来实现情报分析 “Information does not have to be secret to be valuable” 2005年,CIA专门成立了DNI Open Source Center (OSC),主要针对以Internet信息资源为主的开源情报资源进行收集、开放和利用
8
? 1.背景 网络开源科技信息 如何将网络信息从非结构的自由信息转化成可分析的结构化语义化信息,实现网络监测 实现科研机构监测和描绘的
重要科学交流和传播渠道之一; 众多科技战略、科研活动、科研成果通过网络发布; 科学研究和科技战略决策等信息可网络开放获取; 实现科研机构监测和描绘的 良好信息源,但是具有非结构化、缺少语义描述的缺点 ? 如何将网络信息从非结构的自由信息转化成可分析的结构化语义化信息,实现网络监测
9
1.背景 中国科学院国家科学图书馆网络科技信息监测 “网络科技信息监测与评价”项目(“十一五”国家科技支撑计划项目课题)
“科技发展态势自动监测体系”项目(中科院知识创新工程重要方向项目) 网络科技信息中爆发主题的监测与分析方法研究 (社科基金项目) “基于语言网络的文本主题中心度计算方法研究”(自然科学基金项目) “网络科技信息自动监测系统二期建设”(中科院新增能力建设) “重点领域网络信息跟踪保障服务示范平台建设”(NSTL项目)
10
提纲 1.背景 2.问题和思路 3.功能和服务 4.效果
11
2.问题和思路 结构化监测的思路 网络科技信息监测不是说不清楚的、糊里糊涂的,而是可组织、有规律、可计算的监测模式
将网络科技信息监测从一种个人私密的、手工作坊式的监测方式,变成团队共享的、集约化的监测方式
12
结构化监测的思路 Automatic Extraction Data Mining And In-depth Analysis
… Data Mining And In-depth Analysis Research Profiling 在对网络科技信息特征和战略情报团队需求充分调研的基础上,笔者提出了结构化监测的思路和框架。具体而言,对于每一条从网络上采集到的科技信息资源(如HTML页面、PDF文件、WORD文档等),网络科技信息自动监测系统首先通过知识抽取技术,从这些网络信息资源中抽取出嵌在其中的知识对象以及对象间的相互关系,将自由文本转换为结构化的可以计算的知识单元,再基于此,构建各类监测模型(如重要内容判断、热点监测、重要对象跟踪等),实现对研究领域的态势监测。
13
结构化监测的框架
14
2.问题和思路 结构化监测的方法 构建监测本体指导结构化的目标内容监测; 基于对象抽取实现网页内容的结构化表示;
基于对象指标实现网页内容的情报价值计算; 基于对象计算实现监测目标的态势分析
15
2.问题和思路 (1)构建监测本体指导结构化的目标内容监测 科研领域监测本体
从监测目标对象的科研活动这一角度出发,将科研领域的监测内容定义为4个基本概念 被监测的目标主体 目标主题 目标活动 目标国家地区
16
2.问题和思路
17
2.问题和思路 (2)基于对象抽取实现网页内容的结构化表示
抽取出嵌入其中的:科研机构、科研人员、重要战略、重大项目计划、重要研究报告、积分榜、R&D投入等内容监测对象, 并通过语法分析、共现分析、语义计算等方法,构建监测对象关系
18
监测对象及关系抽取 LarKC: The Large Knowledge Collider
监测对象的抽取 LarKC: The Large Knowledge Collider The aim of the EU FP 7 Large-Scale Integrating Project LarKC is to develop the Large Knowledge Collider (LarKC, for short, pronounced “lark”), a platform for massive distributed incomplete reasoning that will remove the scalability barriers of currently existing reasoning systems for the Semantic Web. LarKC is sponsoring the following international scientific events: 11th International Conference on Principles of Knowledge Representation and Reasoning (KR 2008) …… 关系标识 术语 系统平台 项目 学术会议 对象间关系的抽取
19
2.问题和思路 (3)基于对象指标实现网页内容的情报价值计算 网络科技信息自动监测系统每天会采集到大量的网页信息。
如何从这些网页信息中,准确发现并有效揭示有重要情报价值的信息是结构化信息监测需要解决的一个重要问题。 提出了基于监测对象指标实现网页内容的情报价值计算的方法
20
2.问题和思路 (3)基于对象指标实现网页内容的情报价值计算 5维度指标体系 情报来源的权威性 情报的性质类型
来源机构:科技管理机构、科技咨询机构、政府部门、研究机构、国际组织、科技企业、新闻网站等 研究报告(或出版物)目录、新闻目录、事件目录 情报的性质类型 新闻报道性信息、专家观点、深度分析报告、官方重要信息发布、研究成果
21
2.问题和思路 (3)基于对象指标实现网页内容的情报价值计算 5维度指标体系 情报中内容监测对象的重要程度 情报的科技相关度
科技大国、发达国家、金砖五国、新兴经济体 重要战略、重大项目计划、重要研究报告、重要科技指标体系(积分榜)、R&D投入 情报的科技相关度 富含了科技主题词 情报的主题相关度 本文中的对象或科技主题词也对本领域的情报人员没有价值
22
2.问题和思路 (4)基于对象计算实现监测目标的态势分析 基于新对象的识别实现新趋势的识别 基于监测对象的频次分析实现监测目标的重要对象发现
基于监测对象的频次变化实现特定时间周期内的热点分析 基于监测对象的共现分布实现监测目标的关联描绘 基于监测对象的网络资源聚类实现科研活动事件关联揭示 基于对象共现实现特定网络资源相关资源集的发现和聚集
23
提纲 1.背景 2.问题和思路 3.系统和服务 4.效果
24
3.系统和服务 科技信息自动监测系统 能够帮助战略情报研究团队全面及时地跟踪监测多个目标机构和目标领域的动态信息
有效辅助战略情报研究团队识别有重要情报价值的信息 解析PDF、WORD等格式的重要报告内容以识别情报类型 实现监测资源的主题聚类导航 自动揭示重要主题和重要对象 推荐一定时间窗口内的热点对象与热点主题; 战略情报研究人员提供了一个在线计算机情报工作平台,实现了动态监测快报类情报产品的高效率加工生产报道
25
网络科技信息自动监测系统 加工 展示 分析 采集 监测机构定制 监测资源推送 在线情报产品加工平台 实现监测内容归类导航
自动揭示重要主题和重要对象 推荐近期热点对象与热点主题 监测资源统计分析 站内检索监测资源 自动辨别重要科技情报资源 解析富文档情报资源 自动识别情报资源类型 实现文本内重要对象的抽取和揭示 全面监测重要科技机构网站 即时跟踪目标机构领域最新科技动态
26
3.系统和服务 全面监测重要领域机构 即时跟踪领域最新动态 自动辨别重要情报资源 自动汇集重要富文档资源 自动揭示重要对象和主题
自动揭示热点对象与主题
27
3.系统和服务 全面监测重要领域机构 即时跟踪领域最新动态 自动辨别重要情报资源 自动汇集重要富文档资源 自动揭示重要对象和主题
自动揭示热点对象与主题 辅助实现快报的加工编辑
28
3.系统和服务 每日推送最新重要情报,使情报人员及时跟进 日推送示例 周推送示例
29
3.系统和服务 新内容实时、准确发现的科技信息监测采集管理平台
30
3.系统和服务 监测本体、语料建设与管理
31
3.系统和服务 满足情报团队的特殊需要,开发深入领域的监测分析 SPIE特邀 会议论文监测 ISS任务和试验 自动监测分析 与跟踪
32
3.系统和服务 在中国科学院内 实现了5个领域、5个研究所的常规自动监测服务,有效支撑情报团队和研究所图书馆战略情报监测能力的提升(“科技战略与政策”、“空天科技”、“资源与环境”、“能源科技”、“信息科技”5个领域) 青岛生物与能源所、上海光机所、上海药物研究所、大连化物所和生物物理所 NSTL三个重要领域跟踪服务
33
3.系统和服务 构 建 5 个 领 域 常 规 监 测 服 务
34
3.系统和服务 无限的需求已经提出 虽然我们常规支持了这些系统。但还有很多很多的监测需求 研究所 课题组 特定重要科研人员 战略科学家
...
35
3.系统和服务 构建按需申请的监测服务新模式 用户将需要监测的目标情报源提交给我们 由我们来监测和采集目标情报源上的新信息
提供一个监测服务,让用户可以获得监测服务
36
领域独立采集、领域独立计算、门户独立服务
一期建设框架: 领域独立采集、领域独立计算、门户独立服务
37
扩展建设系统: 按需申请,统一采集,分散配置, 个性化计算、定制化服务
38
3.系统和服务
45
3.系统和服务 支持数据分析挖掘的服务平台 Profiling Science and Innovation Policies of Obama Administration by Mining OSTP Web Resources
46
OSTP-The Key Reports Analysis
47
OSTP-The Policy Focuses Analysis
48
OSTP-The policy focuses of each year
2009 2010 2011 2012 2013 economic growth; information technology; health care; science and technology; Climate Change; federal effort; environmental quality; scientific community; cancer research; clean energy economy Climate change; coastal water; human health; Small Business; Global climate; Education Technology; Vaccine Production; national security spacecraft advanced manufacturing; advanced material; national security spacecraft; Research Infrastructure; applied research; scientific integrity Advanced Manufacturing; open data; energy data; climate change; Computer science; government data; Education Data; Clean Energy; Acid Rain; Scientific Integrity clean energy; Global Change; Space Station; data management; spur innovation
49
OSTP-Major initiatives or important projects in a period
50
3.系统和服务 最终目标 建成覆盖全院主要领域的普惠型科技信息监测服务体系 能够有效支持面向战略决策和领域态势分析的网络科技信息挖掘分析平台
51
提纲 1.背景 2.问题和思路 3.系统和服务 4.效果
52
4.效果 情报产品支持情况(快报中来源于自动监测系统的比例)
53
成果2:常规有效的自动监测服务 去除掉快报中的非英语资源、期刊资源以及访问受限资源(例如:需要登录才能访问)之外,2013年4月-2013年7月各领域快报支持情况
54
4.效果 系统监测的重要科技资源对情报人员有重要的参考价值
55
4.效果 系统的作用得到情报团队认可 “《空间科学发展战略与学科前沿动态》快报中报道的很多学科前沿进展均来自监测网站的推荐信息,有效缩短了情报研究人员在信息检索方面的投入时间;另外,SPIE特邀文章的自动监测和推荐,成为《空间光电科技专辑》快报选择稿件的重要工具。” “目前团队18人,均使用该系统,已成为兰州分馆情报团队掌握本领域动态的重要工作手段。” “监测系统为我们团队的战略情报研究工作提供了较大帮组,使我们能够汇集和管理重要的情报源,轻松及时跟踪重要情报源的最新动态,发现重要的情报线索,为团队人员节约了时间和精力。” “这一系统已经成为能源团队开展战略情报研究重要的领域态势监测工具,有效地提升了对本领域内科研活动的监测能力和动态把握能力。” “有效辅组了《国际科技信息专报》、《科技战略与政策动态监测快报》的工作,节省了战略情报人员近一半的时间,已成为战略情报研究不可或缺的重要工具。”
56
支持科技政策情报团队成员 申请国家自科基金 《学科政策动态研究》 支持能源团队成员撰写 研究报告《美国能源科技 创新体系新动向》等,
支持其申报国家自科基金 《基于Web知识挖掘的新能源 战略性新兴产业发展布局研究》 支持科技政策情报人员撰写了研究报告 《学科政策动态研究》、《世界主要国 家及国立科研机构技术转移情况 及启示》、图书《创新集群建设的 理论与实践》、期刊论文《嵌入科研 的情报研究服务新模式探究》 支持资源团队成员撰写论文 《油气资源科技发展特点与趋势》、 申请地区级《地质科学与资源科学 进展监测与分析》 项目 支持信息团队成员编辑 《信息化研究与应用快报》、 《信息科技研究动态监测快报》 支持空天团队成员申请 先导科技专项课题《面向 空间科学发展战略与组织管理的 情报研究》
57
4.效果 支持情报人员利用相应领域的监测服务系统作为个人能力的展示或研究基础来申请其他项目或获取经费支持。目前共支持情报人员获取国家级、院级、地区级项目4项
58
致谢 此报告撰写得到了国科图网络科技信息监测项目组及相关用户的大力支持! 在此一并致谢 欢迎各位专家的批评指正!
Similar presentations