图像检索技术综述.

Slides:



Advertisements
Similar presentations
——Windows98与Office2000(第二版) 林卓然编著 中山大学出版社
Advertisements

SEWM2006 Web检索 山东大学 陈竹敏.
学习报告 Hadoop在IR中的应用 洪晨花 基础软件国家工程研究中心 2017年3月17日.
第三章 数据类型和数据操作 对海量数据进行有效的处理、存储和管理 3.1 数据类型 数据源 数据量 数据结构
UI(用户界面)集训班 Illustrator 高级班.
第四次大作业 登陆学校图书馆网站的电子数据库
2-7、函数的微分 教学要求 教学要点.
计算机基础知识 丁家营镇九年制学校 徐中先.
《数据库原理及应用》课程介绍 信息工程学院 孙俊国
                                                                                                                                                                
DM81X 视频采集处理 ——MCFW框架介绍 广州创龙电子科技有限公司
SVN的基本概念 柳峰
Computer Graphics 计算机图形学基础 张 赐 Mail: CSDN博客地址:
面向对象建模技术 软件工程系 林 琳.
Chinese Virtual Observatory
物体识别 3D建图 semantic mapping
管理信息结构SMI.
SQL Injection.
第11章:一些著名开源软件介绍 第12章:服务安装和配置 本章教学目标: 了解当前一些应用最广泛的开源软件项目 搭建一个网站服务器
基于全方位视觉的多人体运动检测跟踪 利用全方位摄像机获取360˚ 的环境信息,在室内对多个人体目标进行实时运动检测。
第一单元 初识C程序与C程序开发平台搭建 ---观其大略
数 控 技 术 华中科技大学机械科学与工程学院.
以ISI平台为例,为您演示一下如何在Endnote文献中查看该文献的References
第17章 网站发布.
数据挖掘工具性能比较.
整合思维导图的初中英语教学设计 主讲人:卢璐.
中国科学技术大学计算机系 陈香兰(0551- ) Spring 2009
ScienceDirect高级检索功能及使用视频、说明发现路径
绿色圃中小学教育网 比例 比例的意义 绿色圃中小学教育网
搜 刘智 iLife信息素养协会 索.
第3章 信息与信息系统 陈恭和.
美国数学学会 MathSciNet 电子资源的检索和使用
宁波市高校慕课联盟课程 与 进行交互 Linux 系统管理.
SOA – Experiment 2: Query Classification Web Service
编程作业3:网页正文抽取 (10分).
图片与视频数字化. 图片与视频数字化 图片分类 根据图片的构成元素来分 位图: 由像素组成,计算机按顺序存储每个像素点 的颜色信息的保存方式获得的图片。 位图放大后会模糊失真,存储空间相对较大。 矢量图: 由图元组成,通过数学公式计算获得的图片。 放大后不会失真,占用空间小。
C语言程序设计 主讲教师:陆幼利.
学习目标 1、什么是字符集 2、字符集四个级别 3、如何选择字符集.
论文答辩PPT模板 答辩学生:橘子皮 指导老师:PPT工作室.
第四章 团队音乐会序幕: 团队协作平台的快速创建
2019/4/16 关注NE官方微信,获取更多服务.
基于X-Service的移动服务平台开发
VisComposer 2019/4/17.
网页设计与制作 —— 学习情境二:网页模板设计
实验四、TinyOS执行机制实验 一、实验目的 1、了解tinyos执行机制,实现程序异步处理的方法。
商业分析平台-语义元数据 用友集团技术中心 边传猛 2013年 11月 06日.
Cassandra应用及高性能客户端 董亚军 来自Newegg-NESC.
数据库使用指南 Nature全文数据库.
中国国家标准文献 共享服务平台检索 信息检索与利用 2019/4/29 王婧怡 图书馆615室 科技信息研究所
2019/4/ /4/25 学习科研好助手 NoteExpress文献管理与检索系统 北京爱琴海乐之技术有限公司.
计算机网络与网页制作 Chapter 07:Dreamweaver CS5入门
项目二:HTML语言基础.
第八章 总线技术 8.1 概述 8.2 局部总线 8.3 系统总线 8.4 通信总线.
魏新宇 MATLAB/Simulink 与控制系统仿真 魏新宇
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
人工智能 制作人:蔡燊林 张恩玮.
学习目标 1、如何对结果进行分组 2、分组函数的一些实用方法.
SpringerLink数据库使用说明 上海师范大学图书馆
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
图片与视频数字化. 图片与视频数字化 图片分类 根据图片的构成元素来分 位图: 由像素组成,计算机按顺序存储每个像素点 的颜色信息的保存方式获得的图片。 位图放大后会模糊失真,存储空间相对较大。 矢量图: 由图元组成,通过数学公式计算获得的图片。 放大后不会失真,占用空间小。
基于列存储的RDF数据管理 朱敏
Adj + Noun映射到知识库中的classes
第十七讲 密码执行(1).
第十二讲 密码执行(上).
FVX1100介绍 法视特(上海)图像科技有限公司 施 俊.
位似.
香港城市大学 导师: 布礼文教授( Dr. L M Po ) 学生: 徐叙远 ( Xu Xuyuan )
入侵检测技术 大连理工大学软件学院 毕玲.
《手把手教你学STM32-STemWin》 主讲人 :正点原子团队 硬件平台:正点原子STM32开发板 版权所有:广州市星翼电子科技有限公司
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Presentation transcript:

图像检索技术综述

图像检索技术的发展历史 当前主流的图像检索技术介绍 一个图像搜索引擎的系统模型 本文主要内容 图像检索技术的发展历史 当前主流的图像检索技术介绍 一个图像搜索引擎的系统模型

(Text-based Image Retrieval) 沿用了传统文本检索技术,利用文本描述的方式表示图像的特征。 20世纪70年代: TBIR (Text-based Image Retrieval) 基于文本的图像检索技术 沿用了传统文本检索技术,利用文本描述的方式表示图像的特征。

早期的TBIR: 手工对图像进行注释,工作量相当大,不可避免地会带来主观性和不精确性 Internet环境下的TBIR: 网页信息的自动采集和标引技术 索引方式:全文索引和关键词索引 Google,Yahoo和百度等搜索引擎所提供的图像检索服务,它们采用的都是TBIR技术.

TBIR的优点:使用成熟的文本检索和搜索引擎技术,符合人们的检索习惯,实现简单

TBIR的缺点:标注的准确性差,也不能满足用户对图像原始特征信息的检索

MPEG-7 国际标准化组织ISO/IEC 制定的MPEG-7国际标准,该标准的正式名称为“多媒体内容描述接口”(Multimedia Content Description Interface),为各类多媒体信息提供一种标准化的描述,并将该描述与所描述的内容相关联,极大地促进了对各种多媒体信息的快速查询和访问。 该标准于1998年10月提出,于2001年最终完成并公布。

MPEG-7标准化的范围包括: 一系列的描述子(描述子是特征的表示法,一个描述子就是定义特征的语法和语义学); 一系列的描述结构(详细说明成员之间的结构和语义); 一种详细说明描述结构的语言、描述定义语言(DDL); 一种或多种编码描述方法。

(Content-based Image Retrieval) 90年代以来: CBIR (Content-based Image Retrieval) 基于内容的图像检索 对图像的视觉内容,如图像的颜色、纹理、形状等进行分析和检索图像。 其特点是图像本身包含的客观视觉特性,不需要人为干预和解释,能够通过计算机自动实现对图像特征的提取和存储。

CBIR进行检索时利用的是第2层的特征。特征提取是CBIR系统最基础的部分,在很大程度上决定了CBIR系统的成败. [1] 第3层:语义特征层 人们对图像内容概念级的反映 第2层:物理特征层 图像的颜色、纹理、形状和轮廓等低层物理特征 第1层:原始数据层 图像的原始像素点 图1 图像内容的层次模型 CBIR进行检索时利用的是第2层的特征。特征提取是CBIR系统最基础的部分,在很大程度上决定了CBIR系统的成败. [1] 特征提取

1  基于颜色特征的检索 实践表明,基于颜色的CBIR系统具有较好的性能,而且实现相对容易.最常用的表达颜色特征的方法是颜色直方图。 其他常用的颜色特征表示方法还有颜色矩和颜色相关图。 [2]  

2  基于纹理特征的检索 纹理是一种不依赖于颜色或亮度的反映图像中同质现象的视觉特征,对图像灰度变化的特征进行量化,与对象的位置、走向、大小、形状有关,与平均灰度级无关。 图像检索中用到的纹理特征表示方法主要有:Tamura法、小波变换和自回归纹理模型。 [3]

3  基于形状特征的检索 形状特征常与目标联系在一起,需提取目标的轮廓或描述目标轮廓所包围的区域的性质。因此形状比颜色和纹理的语义性更强。 基于边界的表示:代表方法是傅里叶描述子。其基本思想是用对图像进行傅里叶变换得到的边界作为形状描述. 其中一个优点就是把二维问题简化为一维问题。 基于区域的表示:代表方法是不变矩法。

CBIR系统向用户提供的查询方式 示例查询就是由用户提交一个或几个例子图像,然后由系统检索出特征与之相似的图像.这里的“相似”,指的是上述的颜色、纹理和形状等几个视觉特征上的相似。 草图查询:用户可以简单地画一幅草图,由系统检索出视觉特征上与之相似的图像。

目前基于内容图像检索技术已经取得了不少的成就,一些著名的图像检索系统相继被推出,有IBM的 QBIC 系统,哥伦比亚大学开发的 Visual-SEEK,MIT多媒体实验室开发的 Photo-Book,U C Berkeley开发的 Chabot 系统等。

CBIR利用图像本身固有的物理信息,能够对图像的颜色、纹理和形状等特征进行比较,在指纹识别、商标检索和医学图像检索等特定领域得到了广泛应用,因为这些领域的图像在某些特征上容易识别,比如同一个手指的指纹其纹理是一样的。 然而,Internet上的图像来自不同的领域,根本无法捕获其共同点,用基于内容的方法对这些图像进行检索,其效果远不能令人满意.

基于语义的图像检索 基于语义的图像检索的目的,就是要使计算机检索图像的能力达到人的理解水平。  基于语义的图像检索 基于语义的图像检索的目的,就是要使计算机检索图像的能力达到人的理解水平。 在图1所示的图像内容层次模型中,语义位于最高层:第3层。第2层和第3层之间的差别被许多学者称为“语义鸿沟” (semantic gap)。缩小语义鸿沟的办法有2种:由高层语义导出低层特征和由低层特征向高层语义的转换。 语义鸿沟的存在是目前CBIR系统还难以被普通用户接受的原因.在某些狭窄的专业领域,比如指纹识别和医学图像检索中,将图像低层特征和高层语义建立某种联系是可能的,但是在广泛领域内,低层视觉特征与高层语义之间并没有很直接的联系.如何最大限度地减小图像简单视觉特征和丰富语义之间的鸿沟问题,是语义图像检索研究的核心.其中的关键技术,就是如何获取图像的语义信息.

在原有检索系统中加入高级语义到低层特征的转化,可以在不改变现有的图像特征库和匹配方式的情况下,实现基于语义的图像检索,其基本框图见图2. 图像语义的提前过程是由低层特征向高层语义转化的过程。在获取语义和有效地表达语义的基础上,可以建立语义索引,提取图像语义的模型见图3。

高层语义导出低层特征 反馈信息 检索结果 图像数据库管理 特征比较 图像特征库 特征提取 图2 基于语义的图像检索系统框图 结果输出 语义查询 相似性比较

对象空间 关系分析 对象识别 图像分割 局部视觉 特征提取 全局抽象 语义处理 全局视觉 图像标注 用户交互 外部信息 原始图像 图像语义描述 图3 图像语义提取模型 利用系统知识的语义提取 基于系统交互的语义生成 基于外部信息的语义提取

基于反馈的图像检索 相关反馈方法的基本思想是在检索过程中,允许用户对检索结果进行评价和标记,指出结果中哪些是用户希望得到的查询图像,哪些是不相关的,然后将用户标记的相关信息作为训练样本反馈给系统进行学习,指导下一轮检索,从而使得检索结果更符合用户的需要。

基于知识的图像检索 将人工智能领域的基于知识的处理方法引入到图像处理领域,通过对图像理解、知识表达、机器学习,并结合专家和用户的先验知识,建立图像知识库实现对图像数据库的智能检索。主要涉及到自然语言理解、专家系统、知识表达和机器学习等人工智能的主要研究领域。

一个图像搜索引擎的系统模型 SeekImg系统是华中科技大学图像识别与人工智能研究所开发的,一个www上的图像搜索引擎的原型系统。[4] 该系统采用Internet搜索技术、图像自动识别技术和基于内容的图像检索技术,基于C1ient/Server 架构和 Microsoft SQL Server/NT 平台研制开发。

SeekImg由四部分组成:爬虫部分、图像处理、图像数据库和查询服务器。 查询界面 用户 数据库 数据库维护 图4 SeekImg的系统结构图 示例图像文字信息 结果 示例图像 索引向量 文字信息 图像

爬虫又称为“www图片自动搜寻和下载模块”,主要完成从www网站上寻找图片并下载到系统的服务器上;图像处理部分是SeekImg的核心模块,主要完成下载的图像的自动分析和特征信息的自动提取;数据库部分在服务器端完成SeekImg的图像信息组织,在客户端接受用户的例子图像,通过基于内容的图像检索算法,完成对服务器端图像信息的检索,并将结果输出给用户。[5]

用户可采用的三种查询方式: ① 当用户采用传统的关键字检索方式时,利用图像数据库中的关键字字段进行检索。② 当用户提供了示例图像时,先对示例图像产生索引向量,采用某种距离度量算法,算出示例图像和图像数据库中图片的索引向量之间的距离,得到距离最近的若干幅图片。 ③ 用户也可以指定图像特征,例如,红色30%,黄色50%。服务器将构造出索引向量,然后找出距离最近的若干幅图片。

参考文献 [1]贺玲, 吴玲达, 蔡益朝. CBIR 中的索引技术综述[J].小型微型计算机系统.2006,vol.27:141-145 [2]刘忠伟,章毓晋.十种基于颜色特征的图像检索算法的比较和分析[J].信号处理,2OOO,16(1):79-84 [3]MA W Y,ZHANG H J.Benchmarking of Image Features for Content-based Retrieval[C]//The 32nd Asilomar Conference on Signals,Systems& Computers.Pacific Grove,California,USA:IEEE CS Press,1998.

[4]陈韶斌,丁明跃,周成平.WWW上的图像搜索引擎系统SeekImg[J].计算机与数字工程,2OO2,30(2):55-54 [5]陈迎,唐洁茹.一种www 图像搜索引擎的模型与实现[J].武汉理工大学学报,2OO1,23(1):26-29