Download presentation
Presentation is loading. Please wait.
1
基于内容的视频检索系统 ——开题答辩
2
目录 项目背景概要 项目边界 关键问题及难点的分析 项目计划与管理 开发工具及开发模型 系统测试 参考文献
3
项目背景 随着多媒体技术和网络技术的发展,人们越来越容易创建和传播数字多媒体产品。传统的视频检索系统主要是基于人工注释的文本检索,但是这种方法明显的存在不足。为了满足如今海量的视频检索需求,基于内容的视频检索技术便应运而生。
4
项目背景(续) 国内外的发展现状 第一代视频信息检索系统:
5
项目背景(续) 国内外的发展现状 第二代视频信息检索系统:(基于内容的视频检索)
如QBIC(IBM)、JACOB(PLERMO大学)、Tv-FI(清华大学)K、iVideo(中科院),基于镜头质心特征向量的视频相似度衡量方法(浙大潘云鹤)
6
项目概要(开发内容) 我们团队的工作任务就是设计一款基于内容的视频检索软件,该软件可以对多媒体对象的内容以及上下文予以环境进行检索,如针对视频中的图像颜色,纹理,形状,场景镜头的运动等进行检索比对。 待开发的视频检索系统:(核心内容)
7
项目概要(团队) 小组的组织形式 层次式小组(介于搞结构化和松散结构两者之间) 项目管理人员: 负责软件项目的管理工作,指导老师叶勇
开发人员: 掌握了开发一个产品或应用所需的专门技术,胜任包括需求分析、设计、编码、测试等各种相关的开发岗位 黄芳芳、时佳楠、郑海宏、武彦杰 小组的组织形式 层次式小组(介于搞结构化和松散结构两者之间)
8
项目边界 项目名称:基于内容的视频检索系统 项目用途:针对有关足球比赛这一范畴内 的特定视频信息检索 视频格式:MPEG-7
项目用途:针对有关足球比赛这一范畴内 的特定视频信息检索 视频格式:MPEG-7 视频长度:90MIN 信息检索分类: 1. 射门 2. 边界球 3. 角球 4. 任意球
9
项目边界 检索系统的基本结构
10
关键问题及难点分析 关键问题: 特征数据库的形成阶段 1. 镜头分割 2. 关键帧提取 3. 特征提取
11
关键问题及难点分析(续) 难点处理 1. 镜头分割 首先使用DirectShow 将视频划分为若干个帧。
镜头分割方法:基于彩色直方图的分割。 有若干种方法,选取直方图帧差法(B2B) 其中N为像素总数,Fd 大于某一值时,可定位分割点 1.场景 镜头 帧。 1直方图帧差法,X2检验直方图差法, 最小帧差法, 平均彩色法
12
关键问题及难点分析(续) 难点处理 2. 关键帧提取 直方图平均值法 基于镜头方法 基于内容分析方法 基于运动分析的方法
系统采用基于内容分析方法 定义两幅图像fi和fj的帧差为: 通过比较两个候选帧距离D(fi,fj)与预定阀值T的大小关系,可以确定关键帧 1.场景 镜头 帧。
13
关键问题及难点分析(续) 难点处理 3. 特征提取 4.建立索引
可以由MEPG-7的视频格式特性来提取出相关特征(如颜色,纹理,形状等)来建立特征索引 4.建立索引 该系统采用Hash索引作为视频数据库的索引方式 有点:迅速,准确的检索出其属性值与查询所指定的属性值相一致的记录集合。 如:射门,角球等。 映射规则: F(x) = x mod N N为哈希表的桶数, x为属性值,可用数字形式表示 1.场景 镜头 帧。
14
项目计划与管理 项目分解 目的:明确项目所包含的各项工作; 项目分解的结果就是WBS图
15
项目计划与管理(续) 项目人员 项目管理人员: 负责软件项目的管理工作,指导老师叶勇 开发人员:
掌握了开发一个产品或应用所需的专门技术,胜任包括需求分析、设计、编码、测试等各种相关的开发岗位 黄芳芳、时佳楠、郑海宏、武彦杰 小组的组织形式 层次式小组(介于搞结构化和松散结构两者之间)
16
项目计划与管理(续) 进度估算 目标:确保软件项目在规定时间内按期完成,本小组采用甘特图来建立项目进度表
17
项目计划与管理(续) 分工问题 开题报告:时佳楠、武彦杰、黄芳芳 需求分析:郑海宏、黄芳芳、武彦杰 概要设计:郑海宏、黄芳芳、时佳楠
详细设计:武彦杰、时佳楠、黄芳芳 编码实现:武彦杰、郑海宏、时佳楠 系统测试:时佳楠、武彦杰 质量管理:黄芳芳、郑海宏
18
项目计划与管理(续) 质量管理 考虑到要在预算和进度范围内交付,因此在项目进行过程中要对偏差进行控制 质量控制 采用技术手段保证软件质量
组织技术评审 加强软件测试 质量保证 软件评审在软件工程过程的每个活动的后期进行 两个主要的评审活动:项目管理评审和技术评审
19
平台及工具 平台及工具 应用环境:Microsoft Window XP 设计环境:Microsoft Visual Studio 2008
数据库工具:MySQL 使用工具:DirectShow (DirectX SDK9.0) OCR软件 测试工具:Rational Robot Rational Purify 由于视频流大多是以压缩格式存在的视频文件,如MPEG、AVI等,因此工作的第一步就是要实时地捕获视频帧。微软公司已经提供了完整的解决方案,它所提供的DirectShow工具可在多种格式的视频流中获得完整的帧数据。 利用OCR软件,实现视频流中的文字识别。
20
开发模型: 瀑布模型
21
系统测试 1.以单元测试为主。 2. 功能测试以黑盒测试为主。编写测试用例进行功能测试。
主要以基本算法为单位。一个关键性算法为一个测试单元进行白盒测试。 2. 功能测试以黑盒测试为主。编写测试用例进行功能测试。 关键帧特征提取 基于关键帧特征检索
22
参考文献 寿航军.基于内容的视频检索系统研究与设计.西安电子科技大学硕士学位论文 徐丹.基于内容的视频检索系统研究.武汉理工大学硕士学位论文
刘伟.基于内容的视频检索系统的研究与实现.北京交通大学专业硕士学位论文 贾庆萍.视频镜头分割技术与基于内容的视频检索系统研究.山东大学硕士学位论文 肖明.基于内容的多媒体信息索引与检索概论.人民邮电出版社,2009 冯大淦,萧允治,张宏江.多媒体信息检索与管理.清华大学出版社, 张洪德.基于内容的视频检索技术研究.国防科学技术大学硕士学位论文,2002 罗凤玲.视频检索中的特征提取方法研究.国防科学技术大学硕士学位论文,2002 章毓晋.基于内容的视觉信息检索.科学出版社,2003
Similar presentations