网络信息检索与采集 ——网络多媒体信息检索与采集 主讲人:许珍 王国硕
网络多媒体信息检索与采集 一.多媒体信息概述 二. 多媒体信息检索的形式 三. 图像信息检索与采集 四. 音频信息检索与采集 五. 视频信息检索与采集
一.多媒体信息概述 按照国际电信联盟ITU-T 建议的定义,媒体可以有感觉媒体、表示媒体、表现媒体、存储媒体和传输媒体等多种媒体类型。 随着信息技术的发展,人类已经能够将文字、声音、图像等信息按照相互的内在联系组织在一起,形成新的信息集合,全面表征事物形态,这就是多媒体信息。 当前多媒体中重点讨论的是感觉媒体和表示媒体,即声音、图形、图像、文字、视频和动画等信息载体及其各种编码形式。
一.多媒体信息概述—种类和文件格式 (一)图片文件(图形与图像通常混称为图片文件)
(1)图片文件的特性 ①分辨率 :指图像中存储的信息量,是每英寸(1英寸=2.54厘米)图像内有多少个像素点。图片文件通过计算机的显示器屏幕显示出来,由于屏幕上的点、线和面都是由像素组成的,显示器可显示的像素越多,画面就越精细。显示分辨率相同时,显示屏越小图像越清晰;显示屏大小固定时,显示分辨率越高图像越清晰。一张图片其横行的像素个数和竖列的像素个数便决定了该图片的大小。如800×600,1024×768,1280×1024。目前15英寸LCD的最佳分辨率为1024×768,17~19英寸的最佳分辨率通常为1280×1024,更大尺寸拥有更大的最佳分辨率。
②颜色数 :图片颜色种类数的取值有2色(这时图片只有黑白两 色)、16色、256色(8位)、16位增强色(2的16次方即65536种 颜色)、24仿真彩色(2的24次方即16777216种颜色)等。自然图 片的颜色数越多,图片的视觉效果就越好。
对屏幕上的每一个像素来说,256种颜色要用8位二进制数表示,即2的8次方,因此我们也把256色图形叫做8位图;如果每个像素的颜色用16位二进制数表示,我们就叫它16位图,它可以表达2的16次方即65536种颜色;还有24位彩色图,可以表达16,777,216种颜色。等离子一般都支持24位真彩色。大多数投影机都支持24位真彩色。
(2)图片文件的格式类型 ①位图:由许多个像素点组成的图片,相应的图片文件记录了图形或图像的每一个像素点的位置及代表该像素颜色的数值等信息。根据有无压缩或压缩的方法等,该类型的图片文件又分为许多种格式,如:.bmp图 、.tif图 、. gif图 、.jpg图 ②矢量图 :计算机通过数学运算而产生的图形,而不是像位图那样逐点描述的,因此,该图形所占容量很小,而且它的显示效果不受大小或显示器分辨率的影响。
先从概念说起: 矢量图是根据几何特性来绘制图形,是用线段和曲线描述图像,矢量可以是一个点或一条线,矢量图只能靠软件生成,矢量图文件占用内在空间较小,因为这种类型的图像文件包含独立的分离图像,可以自由无限制的重新组合; 位图图像也称为点阵图像,位图使用我们称为像素的一格一格的小点来描述图像。
最大的区别:矢量图形与分辨率无关,可以将它缩放到任意大小和以任意分辨率在输出设备上打印出来,都不会影响清晰度,而位图是由一个一个像素点产生,当放大图像时,像素点也放大了,但每个像素点表示的颜色是单一的,所以在位图放大后就会出现咱们平时所见到的马赛克状。
位图表现的色彩比较丰富,可以表现出色彩丰富的图象,可逼真表现自然界各类实物;而矢量图形色彩不丰富,无法表现逼真的实物,矢量图常常用来表示标识、图标、Logo等简单直接的图像。
抗风雪图片
抗风雪图片
抗风雪图片
华南虎事件——“正龙拍虎” 陕西省安康市镇坪县城关镇文彩村七组村民周正龙,于2007年10月3日在该县神州湾一处山崖旁,用胶片和数码照相机同时拍摄到两组清晰的野生华南虎照片,经陕西省林业厅组织野生动物专家和影像专家共同鉴定,照片是真实的。
2007年10月15日,网上出现了一个帖子,《陕西华南虎又是假新闻?》,帖主“党指挥枪”在文章里提到“陕西出现华南虎”的新闻被众多媒体转载之后,也引来了不少质疑的声音。质疑声音中,主要是针对老虎图片的6个疑点,并指出,该新闻所配的老虎图片有PS之嫌,并要求网友们都来帮忙鉴定。随后,照片真实性受到来自部分网友、华南虎专家和中科院专家等方面质疑,并引发全国性关注。
2008年11月17日,陕西省安康市中级人民法院在旬阳县法院大审判庭对“华南虎照”造假者周正龙案进行公开开庭审理。经过长达12个多小时的庭审,安康市中院二审判决被告人周正龙犯诈骗罪,判处有期徒刑两年,并处罚金2000元。 华南虎事件已演变成了一个引起国际媒体关注、全国无数网民持续追问的“丑闻”,严重影响社会道德、法治的建设,不容忽视。
2012年4月27日,华南虎事件主角周正龙出狱,出狱一年来,多次上山寻找华南虎,为了捕捉到老虎的影像,还在山上安装了多台动感照相机。 2015年2月9日下午16时30分,周正龙和妻子罗大翠赶到北京。2月10日上午,周正龙向最高人民法院递交刑事申诉状。申诉状例认为当年指控周正龙造假翻拍年画虎一案“是司法介入错误、一二审判决认定事实错误……是错捕错审错判的大冤案,对申诉人和社会都造成了严重后果,应予以尽快撤销”。
这张照片是41岁的摄影师刘为强的作品。从2006年3月起,他就开着自己的吉普车在青藏高原上露营,这是地方报纸《大庆晚报》一项高调系列报导活动的一部分,旨在加强人们对珍稀动物藏羚羊的认识。 2006-CCTV年度十大新闻图片的《藏羚羊生命中的十道难关——铁路关》
2008年2月,搜狐出品网络专题新闻质疑《藏羚羊生命中的十道难关——铁路关》摄影作品是被PS过的假照片?刘为强在事后接受媒体采访时,承认照片确为后期合成。他表示,画面中羚羊照片、火车照片的确不是同一时刻拍摄,而仅是在同一地点拍摄,为了追求“更有感染力”的画面,才合成在一起的。 网友打趣说,“周老虎”风波未平、虚虚实实;“刘羚羊”横出江湖、真相大白。 后来央视通过其官方网站发表的通告中表明,作为主办方,由于未及时发现该图片的造假问题,给这张电脑合成照片最终蒙混过关提供了可乘之机,对此,组委会特别向观众、摄影界、网民道歉。
藏羚羊假图片
2.声音 (1)波形音频 波形音频是从真实的声音录制并数字化后而得到的一种声音文件,这样的一个过程称为声音采样。采样频率越高,录制的声音效果就越好,需要花费的代价是声音文件需要的存储空间加大了。波形音频文件常见的格式有: Wave文件(*.wav) 、MPEG音频文件(.mp1/.mp2/.mp3)、RealAudio文件(ra/.rm/.ram) 、WMA(.wma)格式 。
音乐格式转换器 是一类将mp3、 wma、wav、ogg 等各种音乐格式互相转换的音频转换软件,属于多媒体软件,一般可以在 mp3、wma、wav、ogg等常见音频格式之间相互转换。
(2)MIDI音乐 MIDI是乐器数字接口(Musical Instuments Digital Interface)的英文缩写,是数字音乐/电子合成乐器的统一的国际标准。 MIDI音乐是利用电子合成技术来模拟各种乐器音效的方法生成,它并不对声音进行采样和量化,记录的也不是声音本身,它只是像记录乐谱一样将每个音符记录为一个类似乐谱符号的数字,并且规定了各种音调的混合发音,最后通过合成器将这些数字转化为对应的音效进而组合成为音乐播出。
MIDI文件的数据量要比波形音频文件小得多,可用于满足播放较长时间的音乐需要。
3.视频
(1)数字视频的几个概念 帧 :数字视频利用人的眼睛的视觉暂留原理,将一系列顺序排列的静态画面连续播放,从而产生动态效果,其中的每一个画面就是该视频文件的一帧。 压缩与解压缩 全运动播放 播放速度在30帧/s以上,播放的效果才不会感到跳跃和闪烁,这样的播放速度即所谓全运动播放。 全屏幕播放 视频的播放满足画面大小为640 x 480以上、颜色在256色以上,即可以在整个显示器屏禁区域播放,而不仅仅是在一个小窗口播放,即为全屏幕播放。
(2)数字视频文件格式 ① 动画文件 动画文件指由相互关联的若干帧静止图象所组成的图象序列,这些静止图象连续播放便形成一组动画,通常用来完成简单的动态过程演示;该类型的图片文件又分为许多种格式,如:GIF文件——.GIF
② 影像文件 主要指那些包含了实时的音频、视频信息的多媒体文件,其多媒体信息通常来源于视频输入设备,由于同时包含了大量的音频、视频信息。 如AVI文件(.AVI ) 、QuickTime文件(.MOV/.QT )、MPEG文件(.MPEG/.MPG/.DAT )、RealVideo文件 (.RM )。
二.多媒体信息检索的方式 1.基于文本的多媒体信息检索技术 首先对多媒体进行人工分析并抽取反映该多媒体物理性和内容特征的关键词,然后对这些关键词进行文字著录或标引,建立类似于文本文献的标引著录数据库,从而将对多媒体信息检索转变成对上述关键词的检索。 检索方式类似于文献信息检索,如综合搜索引擎、中文文献数据库的检索。
2.基于内容的多媒体信息检索技术 基于内容特征的信息检索技术(简称CBR),是对媒体对象的内容及上下文语义环境所进行的检索。 检索原理较为专业,国内相关检索引擎处于发展阶段,重点在于了解使用。
三.图像信息检索与采集 1. 具有代表性的几个图像搜索引擎简介 图像搜索引擎是专门用来搜索图形图像的搜索引擎。它与文字搜索引擎不同的是,查到的最终结果,不是文字形式的类目名、网站名和网页内容,而是一幅幅缩微图片,以及与图片相关的介绍和地址链接。 百度图片搜索(http://image.baidu.com) Google图片搜索(http://images.google.com) Yahoo图片搜索(http://image.yahoo.com) WebSEEK (http://persia.ee.columbia.edu:8008/) Lycos (http://multimedia.lycos.com/) Alltheweb图像搜索(http://multimedia.alltheweb.com/)
百度图片搜索(http://image.baidu.com) 百度图片搜索引擎是世界上最大的中文图片搜索引擎,百度从数十亿中文网页中提取各类图片,建立了世界第一的中文图片库。目前为止,百度图片搜索引擎可检索图片已经近亿张。 百度新闻图片搜索从中文新闻网页中实时提取新闻图片,它具有新闻性、实时性、更新快等特点。 除了具备与Google图片搜索类似的关键词检索方法以外,百度还根据用户的浏览喜好,分门别类的将一些热门词汇整理形成百度图片目录,在其中您可以方便的点击所感兴趣的关键词连接来查看相关图片。
百度图片搜索(http://image.baidu.com)
2.基于内容特征的图像库搜索引擎 国内:百度识图 国外较多(了解): 1、VIRAGE 2、EXCALIBUR 3、QBIC
百度识图(实训) 他是谁?
如果是这个人呢?
3.图像元搜索引擎 国内可用搜网(北大天网前身)代替 http://www.sowang.com/picsearch.htm
国外了解: Ixquick同时搜索AllTheWeb、Gograph和Picsearch的图像搜索引擎。 Ithaki同时搜索Yahoo!、Picsearch、Ditto、AltaVista、Fast、Dino、Cobion的图像搜索引擎。 Mamma同时搜索Ditto、Fast的图像搜索引擎。
实训:图片信息检索与采集 网络下载:利用图片搜索引擎(“东方之星”倾覆) 获取网页中的图片:人民网、腾讯、网易、凤凰网 屏幕截图 Print screen键:抓取整个屏幕 截图软件:如snag it,QQ截图
四.音频信息检索与采集 1.音乐搜索引擎
百度MP3搜索 http://mp3.baidu.com/ 搜狗音乐搜索 http://d.sogou.com/ 爱问音乐搜索引擎 http://m.iask.com/ Sobit音乐搜索引擎(http://www.chinadoremi.com/search/ )采用即时搜索网络资源,目前共有歌曲数据730493首,数据总量1298.08G 搜索MIDI文件搜索引擎MIDI EXplorer(http://www.musicrobot.com/) 可搜索到关于音乐、广播、电视、电影,甚至天气等各种专题的视音频文件的网站(http://chinese.ss.com/)
2.音乐方面的专业共享网站 九天音乐网(http://www.9sky.com) 九天音乐网(www.9sky.com)成立于1999年,是目前国内最大最权威的正版音乐网站。拥有国内曲目数量最大,歌曲收录最全的音乐数据库,提供超过75万首曲目的正版数字音乐和原创、翻唱音乐,提供包括音乐及音乐相关产品 听、载、看、唱、写等全方位服务,多年来一直被各国内、外知名网站评为国内流行音乐第一站。
3.音乐搜索软件 酷狗、酷我、搜狗、QQ音乐等 多是基于中文平台专业的P2P音乐及文件传输软件。用户可以方便、快捷、安全地实现国内最大的音乐搜索查找,支持高音质音乐文件共享下载,提供Internet的即时通讯与文件交换、传输、共享等网络应用。
4.基于内容的音频检索 有一段音频却不知道音频信息怎么办? 在外面听到一曲自己很喜欢的歌,却不知道歌名怎么办? 方法1 :midomi网站:http://www.midomi.com/ 方法2:音乐猎手等app应用。
5.音频信息采集 (1)直接点击下载音频 (2)麦克风录制语音或采集磁带音频:利用软件辅助,如Audition(简易,建议自学。)、cooledit等。 (3)从CD中获取音频 (4)录制计算机放出的声音(内录):利用软件wavecn录制,或附件-录音机 (5)采集视频中的音频:利用软件Audition等 (6)购买音频素材库。
实训二:音频信息检索与采集 下载电影《私人定制》音乐《时间都去哪儿了》mp3 由王铮亮演唱,并用附件-录音机录制一段2分钟的旋律。
五.视频信息检索与采集 1、视频信息检索 基于文本的视频搜索引擎 百度视频 其他专业视频网站:搜狐视频、爱奇艺等。
2、视频信息采集 (1)在已有数字化视频资源中寻找获取
2.从VCD、DVD中捕获视频 3.从录像带中采集视频 4.利用摄像机拍摄,再采集,再用专业软件处理 5.购买视频素材库 6.屏幕录制软件。
premiere
在遵守信息道德的前提下,可使用下列方法获取视频。 IE浏览器-工具-选项-设置-查看文件 就可以找到你刚看到的视频了。(操作)
实训:视频信息检索与采集 采集一段视频《贵州毕节4名留守儿童自杀》