网络信息检索与采集 ——网络多媒体信息检索与采集

Slides:



Advertisements
Similar presentations
音频编辑 第4章第4章. 第 4 章 音频编辑 4.1 数字音频概述 4.2 Audition 音频编辑技术 4.3 习题和思考 内容提要.
Advertisements

第 3 章、音訊媒體. 2 本章大綱 音訊原理 音訊儲存格式 音訊播放 3 影響測量結果的因素 – 以溫度測量為例 測量時間間隔 間隔愈短, 測量次數愈多, 資料愈詳細 間隔愈長, 測量次數愈少, 資料愈粗略 測量單位 單位愈小, 精確度愈高, 需記錄的內容多 單位愈大, 精確度愈低, 需記錄的內容少.
做好迁移引导,提高课堂效率 余姚四中 江跃燕. “ 迁移引导 ” 教学的设计思路 考什 么 怎样 考 如何 应考 解读考试说明 研读高考试题 优化复习方案 培养考试技能 高考试题不仅告诉我们哪些是主干知识,而且 告诉我们主干知识的考查角度; 高考试题不仅告诉我们考查哪些能力,而且告 诉我们这些能力的考查方式。
《金匮要略》(风湿病) 专题学习网站 项目汇报 林昌松 项目内容 《金匮要略》乃中医四大经典名 著之一,一直是高等中医院校的主干 课、必修课,又是中医院校课程的临 床提高课。目前为广州中医药大学重 点课程,所属中医临床基础学科为教 育部重点学科。 风湿病是临床常见病和疑难病。 《金匮要略》首创 “
第十三章 嬰幼兒社會行為的發展與保育.
第六章 多媒体辅助教学系统 一、多媒体基本概念
“一师一优、一课一名师” 及学科教研工作室活动开展及其评价
主計室 請購系統 沈淑芬 助理 分機 2587.
预防青少年犯罪讲座 主讲:扬中市公安局城西派出所 季广富.
家庭教育讲座 兴趣盎然 愿这家庭教育讲座成为我们“和谐家庭”的祝福;让我们成为孩子的祝福;让我们的孩子在和谐家庭的真爱中健康成长、快乐学习……
图形和图形软件 学习目标: 定义位图和矢量这两个概念 列出位图和矢量图像的所有标准文件格式 辨别四种将图形文件载入计算机的方法
2015年政府信息公开及网站信息内容建设工作培训班
保良局何壽南小學 使用牙膏對我們生活的影響 六年級專題報告 姓名﹕李燊樺 班別﹕6B 日期﹕
中 国 戏 曲.
中國歷史人物武則天 G組組員 韋紫恩, 余詩琪 蔡煦齡, 黃榮紳,.
第 9 章 多媒體.
2007年房地产建筑安装企业 税收自查方略 河北省地方税务局稽查局 杨文国.
第11章 网上聊天等多种流行应用 除了前面的一般应用外,在Internet网上还有一些流行的或逐渐流行的应用,如在网上聊天、参加BBS交谈、打IP电话、用手机连网、网上炒股、在网上玩对战游戏、听网上音乐、在网上看电影以及通过Internet网找工作等。这些真是Internet网上的一道风景线,强烈地吸引着人们去试探,去感觉,去潇洒,以至于流连忘返。
模块4 理解和熟悉信息化教学 青海省西宁市湟中一中
第五章 计算机辅助教学.
网络数字化学习资源内容管理.
威海电大开放教育 入学技术培训 2012年4月15日.
因特网多媒体技术.
运用新媒体做好工会工作 中共成都市委党校文化建设教研室 邵 军 年3月19日.
高中信息技术课标教材培训 多媒体技术应用(选修)
市八中学 胡亮平 办公室:F504 高中信息科技 市八中学 胡亮平 办公室:F504
網頁介面設計的基礎理論 講師:鄭靜怡 本教材內容出自於網頁界面設計藝術教程,人民郵電出版社.
第2课 共享网络资源.
這 是 幾 點.
第 9章 多媒体技术基础.
计算机应用基础.
第七章 多媒体应用基础.
本章知识点 了解计算机操作系统的发展历史以及Windows 7操作系统的新功能。 熟悉Windows 7桌面、“开始”菜单、任务栏、窗口
时政发布 制作:宋虹雷.
目标 理解多媒体的基本概念、多媒体信息及技术的特点、多媒体技术的应用。掌握多媒体计算机系统的基本组成及简单原理。
观看视频: 平安行 你我他——两小时查处56件交通违法行为 思考:违纪违章,可能会造成什么样的后果?
單元丁 第二章 為演示準備多媒體元素.
3-1 想做出甚麼樣的網站 現在您對網站、網頁已經有基本的概念了,不過要實際開始製作網站,還需要經過規劃的過程。本章中尚未開始動手設計網頁,而先來學習建立網站的重要觀念也就是網站的規劃與設定,首先您必須先對自己要建立的網站有基本的架構,才能動手建立網站,做好後續網頁設計的工作。可別看這個過程,這是能不能建構出一個好網站的重要關鍵,也是設計網站人員必須用心思考、規劃的部分。
12-1 多媒體 12-2 電腦視覺 12-3 人工智慧 12-4 資料壓縮 12-5 計算理論
数字音频技术 曾兰芳 教育技术学院
第二章音訊媒體.
數位家庭我的家 大導演開麥拉 社區大學電腦講師 黃仲銘
多媒體元素.
和諧社區資訊服務推廣計畫 -軟體雲端社區 資訊研習營
Ulead VideoStudio B  電機四 周思睿.
各種媒體的類型及其差別 Text-tex,txt Audio-wav, mp3, wma, rm, mid
声音的格式 Wav:目前最通用的格式,音质好,但是文件较大 Mp3:目前互联网上音乐的主流,文件小,CD级的音质
魅力四射 結合文字,聲音,影像,圖片之多媒體簡報秀.
Ulead Video Studio 8.0 電機四 王崇安.
第 二 章 信息的获取.
記錄片的剪接與後製 以威力導演5為例 林凱胤
第1章 初识After Effects CS3 本章简介:
計算機概論 請老師填入姓名主講 課本:數位傳真2012 博碩文化出版發行.
常見的聲音格式 MP3 聲音格式:有鑑於WAV 聲音檔實在太大, 因此就產生了MP3 聲音格式。其利用MPEG 壓縮法將音樂進行失真性壓縮, 一段50 MB 左右的WAV 檔轉成MP3格式之後, 往往只剩下 4、5 MB。 雖然MP3 是採用失真性壓縮的演算法, 但還能維持不錯的音質, 一般人並無法聽出轉換前後的細微差別。同時也因為儲存空間大幅減少而廣受歡迎。
视频、动画信息的简单加工 陈 东 旭.
多媒體素材概要 圖片聲音和視迅.
[ ] 2010·课件制作培训.
信息技术能力 提升工程相关要求.
中小学教师信息技术 应用能力提升工程测评平台 平台功能介绍 教师版.
网 站 设 计 与 建 设 Website design and developments
和諧社區資訊服務推廣計畫 -軟體雲端社區 資訊研習營
1 功能.
PPT素材的处理 —— 音频的处理.
PPT外援篇 Photoshop 告别菜鸟三部曲 ——主讲:XXXXXXXXX 我第一次当老师,可能会有些啰嗦,还望各位童鞋海涵!
2-1 數位化概念 2-2 資料的數位化 ※ 2-3 基本數位邏輯處理
特定消耗品說明 (指碳粉匣、墨水匣) 國立清華大學 保管組製作.
研究生出国申请流程 学生使用手册.
计 算 机 应 用 基 础 潍坊学院 计算机工程学院 主讲人 王鑫.
语文(苏教版) 教学建议与课例分析 主 讲: 蔡 伟 浙江师范大学人文学院.
第5章 PowerPoint演示文稿.
Presentation transcript:

网络信息检索与采集 ——网络多媒体信息检索与采集 主讲人:许珍 王国硕

网络多媒体信息检索与采集 一.多媒体信息概述 二. 多媒体信息检索的形式 三. 图像信息检索与采集 四. 音频信息检索与采集 五. 视频信息检索与采集

一.多媒体信息概述 按照国际电信联盟ITU-T 建议的定义,媒体可以有感觉媒体、表示媒体、表现媒体、存储媒体和传输媒体等多种媒体类型。 随着信息技术的发展,人类已经能够将文字、声音、图像等信息按照相互的内在联系组织在一起,形成新的信息集合,全面表征事物形态,这就是多媒体信息。 当前多媒体中重点讨论的是感觉媒体和表示媒体,即声音、图形、图像、文字、视频和动画等信息载体及其各种编码形式。

一.多媒体信息概述—种类和文件格式 (一)图片文件(图形与图像通常混称为图片文件)

(1)图片文件的特性 ①分辨率 :指图像中存储的信息量,是每英寸(1英寸=2.54厘米)图像内有多少个像素点。图片文件通过计算机的显示器屏幕显示出来,由于屏幕上的点、线和面都是由像素组成的,显示器可显示的像素越多,画面就越精细。显示分辨率相同时,显示屏越小图像越清晰;显示屏大小固定时,显示分辨率越高图像越清晰。一张图片其横行的像素个数和竖列的像素个数便决定了该图片的大小。如800×600,1024×768,1280×1024。目前15英寸LCD的最佳分辨率为1024×768,17~19英寸的最佳分辨率通常为1280×1024,更大尺寸拥有更大的最佳分辨率。

②颜色数 :图片颜色种类数的取值有2色(这时图片只有黑白两 色)、16色、256色(8位)、16位增强色(2的16次方即65536种 颜色)、24仿真彩色(2的24次方即16777216种颜色)等。自然图 片的颜色数越多,图片的视觉效果就越好。

对屏幕上的每一个像素来说,256种颜色要用8位二进制数表示,即2的8次方,因此我们也把256色图形叫做8位图;如果每个像素的颜色用16位二进制数表示,我们就叫它16位图,它可以表达2的16次方即65536种颜色;还有24位彩色图,可以表达16,777,216种颜色。等离子一般都支持24位真彩色。大多数投影机都支持24位真彩色。

(2)图片文件的格式类型 ①位图:由许多个像素点组成的图片,相应的图片文件记录了图形或图像的每一个像素点的位置及代表该像素颜色的数值等信息。根据有无压缩或压缩的方法等,该类型的图片文件又分为许多种格式,如:.bmp图 、.tif图 、. gif图 、.jpg图 ②矢量图 :计算机通过数学运算而产生的图形,而不是像位图那样逐点描述的,因此,该图形所占容量很小,而且它的显示效果不受大小或显示器分辨率的影响。

先从概念说起: 矢量图是根据几何特性来绘制图形,是用线段和曲线描述图像,矢量可以是一个点或一条线,矢量图只能靠软件生成,矢量图文件占用内在空间较小,因为这种类型的图像文件包含独立的分离图像,可以自由无限制的重新组合; 位图图像也称为点阵图像,位图使用我们称为像素的一格一格的小点来描述图像。

最大的区别:矢量图形与分辨率无关,可以将它缩放到任意大小和以任意分辨率在输出设备上打印出来,都不会影响清晰度,而位图是由一个一个像素点产生,当放大图像时,像素点也放大了,但每个像素点表示的颜色是单一的,所以在位图放大后就会出现咱们平时所见到的马赛克状。

位图表现的色彩比较丰富,可以表现出色彩丰富的图象,可逼真表现自然界各类实物;而矢量图形色彩不丰富,无法表现逼真的实物,矢量图常常用来表示标识、图标、Logo等简单直接的图像。

抗风雪图片

抗风雪图片

抗风雪图片

华南虎事件——“正龙拍虎” 陕西省安康市镇坪县城关镇文彩村七组村民周正龙,于2007年10月3日在该县神州湾一处山崖旁,用胶片和数码照相机同时拍摄到两组清晰的野生华南虎照片,经陕西省林业厅组织野生动物专家和影像专家共同鉴定,照片是真实的。

2007年10月15日,网上出现了一个帖子,《陕西华南虎又是假新闻?》,帖主“党指挥枪”在文章里提到“陕西出现华南虎”的新闻被众多媒体转载之后,也引来了不少质疑的声音。质疑声音中,主要是针对老虎图片的6个疑点,并指出,该新闻所配的老虎图片有PS之嫌,并要求网友们都来帮忙鉴定。随后,照片真实性受到来自部分网友、华南虎专家和中科院专家等方面质疑,并引发全国性关注。

2008年11月17日,陕西省安康市中级人民法院在旬阳县法院大审判庭对“华南虎照”造假者周正龙案进行公开开庭审理。经过长达12个多小时的庭审,安康市中院二审判决被告人周正龙犯诈骗罪,判处有期徒刑两年,并处罚金2000元。 华南虎事件已演变成了一个引起国际媒体关注、全国无数网民持续追问的“丑闻”,严重影响社会道德、法治的建设,不容忽视。

2012年4月27日,华南虎事件主角周正龙出狱,出狱一年来,多次上山寻找华南虎,为了捕捉到老虎的影像,还在山上安装了多台动感照相机。 2015年2月9日下午16时30分,周正龙和妻子罗大翠赶到北京。2月10日上午,周正龙向最高人民法院递交刑事申诉状。申诉状例认为当年指控周正龙造假翻拍年画虎一案“是司法介入错误、一二审判决认定事实错误……是错捕错审错判的大冤案,对申诉人和社会都造成了严重后果,应予以尽快撤销”。

这张照片是41岁的摄影师刘为强的作品。从2006年3月起,他就开着自己的吉普车在青藏高原上露营,这是地方报纸《大庆晚报》一项高调系列报导活动的一部分,旨在加强人们对珍稀动物藏羚羊的认识。 2006-CCTV年度十大新闻图片的《藏羚羊生命中的十道难关——铁路关》

2008年2月,搜狐出品网络专题新闻质疑《藏羚羊生命中的十道难关——铁路关》摄影作品是被PS过的假照片?刘为强在事后接受媒体采访时,承认照片确为后期合成。他表示,画面中羚羊照片、火车照片的确不是同一时刻拍摄,而仅是在同一地点拍摄,为了追求“更有感染力”的画面,才合成在一起的。 网友打趣说,“周老虎”风波未平、虚虚实实;“刘羚羊”横出江湖、真相大白。 后来央视通过其官方网站发表的通告中表明,作为主办方,由于未及时发现该图片的造假问题,给这张电脑合成照片最终蒙混过关提供了可乘之机,对此,组委会特别向观众、摄影界、网民道歉。

藏羚羊假图片

2.声音 (1)波形音频 波形音频是从真实的声音录制并数字化后而得到的一种声音文件,这样的一个过程称为声音采样。采样频率越高,录制的声音效果就越好,需要花费的代价是声音文件需要的存储空间加大了。波形音频文件常见的格式有: Wave文件(*.wav) 、MPEG音频文件(.mp1/.mp2/.mp3)、RealAudio文件(ra/.rm/.ram) 、WMA(.wma)格式 。

音乐格式转换器 是一类将mp3、 wma、wav、ogg 等各种音乐格式互相转换的音频转换软件,属于多媒体软件,一般可以在 mp3、wma、wav、ogg等常见音频格式之间相互转换。

(2)MIDI音乐 MIDI是乐器数字接口(Musical Instuments Digital Interface)的英文缩写,是数字音乐/电子合成乐器的统一的国际标准。 MIDI音乐是利用电子合成技术来模拟各种乐器音效的方法生成,它并不对声音进行采样和量化,记录的也不是声音本身,它只是像记录乐谱一样将每个音符记录为一个类似乐谱符号的数字,并且规定了各种音调的混合发音,最后通过合成器将这些数字转化为对应的音效进而组合成为音乐播出。

MIDI文件的数据量要比波形音频文件小得多,可用于满足播放较长时间的音乐需要。

3.视频

(1)数字视频的几个概念 帧 :数字视频利用人的眼睛的视觉暂留原理,将一系列顺序排列的静态画面连续播放,从而产生动态效果,其中的每一个画面就是该视频文件的一帧。 压缩与解压缩 全运动播放 播放速度在30帧/s以上,播放的效果才不会感到跳跃和闪烁,这样的播放速度即所谓全运动播放。 全屏幕播放 视频的播放满足画面大小为640 x 480以上、颜色在256色以上,即可以在整个显示器屏禁区域播放,而不仅仅是在一个小窗口播放,即为全屏幕播放。

(2)数字视频文件格式 ① 动画文件 动画文件指由相互关联的若干帧静止图象所组成的图象序列,这些静止图象连续播放便形成一组动画,通常用来完成简单的动态过程演示;该类型的图片文件又分为许多种格式,如:GIF文件——.GIF

② 影像文件 主要指那些包含了实时的音频、视频信息的多媒体文件,其多媒体信息通常来源于视频输入设备,由于同时包含了大量的音频、视频信息。 如AVI文件(.AVI ) 、QuickTime文件(.MOV/.QT )、MPEG文件(.MPEG/.MPG/.DAT )、RealVideo文件 (.RM )。

二.多媒体信息检索的方式 1.基于文本的多媒体信息检索技术 首先对多媒体进行人工分析并抽取反映该多媒体物理性和内容特征的关键词,然后对这些关键词进行文字著录或标引,建立类似于文本文献的标引著录数据库,从而将对多媒体信息检索转变成对上述关键词的检索。 检索方式类似于文献信息检索,如综合搜索引擎、中文文献数据库的检索。

2.基于内容的多媒体信息检索技术 基于内容特征的信息检索技术(简称CBR),是对媒体对象的内容及上下文语义环境所进行的检索。 检索原理较为专业,国内相关检索引擎处于发展阶段,重点在于了解使用。

三.图像信息检索与采集 1. 具有代表性的几个图像搜索引擎简介 图像搜索引擎是专门用来搜索图形图像的搜索引擎。它与文字搜索引擎不同的是,查到的最终结果,不是文字形式的类目名、网站名和网页内容,而是一幅幅缩微图片,以及与图片相关的介绍和地址链接。 百度图片搜索(http://image.baidu.com) Google图片搜索(http://images.google.com) Yahoo图片搜索(http://image.yahoo.com) WebSEEK (http://persia.ee.columbia.edu:8008/) Lycos (http://multimedia.lycos.com/) Alltheweb图像搜索(http://multimedia.alltheweb.com/)

百度图片搜索(http://image.baidu.com) 百度图片搜索引擎是世界上最大的中文图片搜索引擎,百度从数十亿中文网页中提取各类图片,建立了世界第一的中文图片库。目前为止,百度图片搜索引擎可检索图片已经近亿张。 百度新闻图片搜索从中文新闻网页中实时提取新闻图片,它具有新闻性、实时性、更新快等特点。 除了具备与Google图片搜索类似的关键词检索方法以外,百度还根据用户的浏览喜好,分门别类的将一些热门词汇整理形成百度图片目录,在其中您可以方便的点击所感兴趣的关键词连接来查看相关图片。

百度图片搜索(http://image.baidu.com)

2.基于内容特征的图像库搜索引擎 国内:百度识图 国外较多(了解): 1、VIRAGE 2、EXCALIBUR 3、QBIC

百度识图(实训) 他是谁?

如果是这个人呢?

3.图像元搜索引擎 国内可用搜网(北大天网前身)代替 http://www.sowang.com/picsearch.htm

国外了解: Ixquick同时搜索AllTheWeb、Gograph和Picsearch的图像搜索引擎。 Ithaki同时搜索Yahoo!、Picsearch、Ditto、AltaVista、Fast、Dino、Cobion的图像搜索引擎。 Mamma同时搜索Ditto、Fast的图像搜索引擎。

实训:图片信息检索与采集 网络下载:利用图片搜索引擎(“东方之星”倾覆) 获取网页中的图片:人民网、腾讯、网易、凤凰网 屏幕截图 Print screen键:抓取整个屏幕 截图软件:如snag it,QQ截图

四.音频信息检索与采集 1.音乐搜索引擎

百度MP3搜索 http://mp3.baidu.com/ 搜狗音乐搜索 http://d.sogou.com/ 爱问音乐搜索引擎 http://m.iask.com/ Sobit音乐搜索引擎(http://www.chinadoremi.com/search/ )采用即时搜索网络资源,目前共有歌曲数据730493首,数据总量1298.08G 搜索MIDI文件搜索引擎MIDI EXplorer(http://www.musicrobot.com/) 可搜索到关于音乐、广播、电视、电影,甚至天气等各种专题的视音频文件的网站(http://chinese.ss.com/)

2.音乐方面的专业共享网站 九天音乐网(http://www.9sky.com) 九天音乐网(www.9sky.com)成立于1999年,是目前国内最大最权威的正版音乐网站。拥有国内曲目数量最大,歌曲收录最全的音乐数据库,提供超过75万首曲目的正版数字音乐和原创、翻唱音乐,提供包括音乐及音乐相关产品 听、载、看、唱、写等全方位服务,多年来一直被各国内、外知名网站评为国内流行音乐第一站。

3.音乐搜索软件 酷狗、酷我、搜狗、QQ音乐等 多是基于中文平台专业的P2P音乐及文件传输软件。用户可以方便、快捷、安全地实现国内最大的音乐搜索查找,支持高音质音乐文件共享下载,提供Internet的即时通讯与文件交换、传输、共享等网络应用。

4.基于内容的音频检索 有一段音频却不知道音频信息怎么办? 在外面听到一曲自己很喜欢的歌,却不知道歌名怎么办? 方法1 :midomi网站:http://www.midomi.com/ 方法2:音乐猎手等app应用。

5.音频信息采集 (1)直接点击下载音频 (2)麦克风录制语音或采集磁带音频:利用软件辅助,如Audition(简易,建议自学。)、cooledit等。 (3)从CD中获取音频 (4)录制计算机放出的声音(内录):利用软件wavecn录制,或附件-录音机 (5)采集视频中的音频:利用软件Audition等 (6)购买音频素材库。

实训二:音频信息检索与采集 下载电影《私人定制》音乐《时间都去哪儿了》mp3 由王铮亮演唱,并用附件-录音机录制一段2分钟的旋律。

五.视频信息检索与采集 1、视频信息检索 基于文本的视频搜索引擎 百度视频 其他专业视频网站:搜狐视频、爱奇艺等。

2、视频信息采集 (1)在已有数字化视频资源中寻找获取

2.从VCD、DVD中捕获视频 3.从录像带中采集视频 4.利用摄像机拍摄,再采集,再用专业软件处理 5.购买视频素材库 6.屏幕录制软件。

premiere

在遵守信息道德的前提下,可使用下列方法获取视频。 IE浏览器-工具-选项-设置-查看文件 就可以找到你刚看到的视频了。(操作)

实训:视频信息检索与采集 采集一段视频《贵州毕节4名留守儿童自杀》