以碎形正交基底和時間情境圖為基礎進行之視訊檢索 Video retrieval based on fractal orthogonal bases and temporal graph 阿凡達 研究生:張敏倫 指導教授:蔣依吾博士 國立中山大學資訊工程學系.

Slides:



Advertisements
Similar presentations
1 第一章:绪论 什么是信源编码? 为什么要信源编码 / 数据压缩? 为什么可以信源编码 / 数据压缩? 怎样进行信源编码?
Advertisements

第一章 信息技术与现代教育技术 教学目的与任务 1 .掌握信息技术的一些基本概念和 常用术语。 2 .掌握信息技术的基本内容。 3 .了解信息技术与教育的发展。
MPEG Family.
基於OPAC的CALIS聯合目錄 資源整合與檢索 Resource Integration and Retrieval in CALIS Union Catalog Based on OPAC System 劉春玥 Liu Chunyue (CALIS聯合目錄部,北京大學圖書館) (CALIS Union.
2.2.1 等比数列的概念和通项公式.
五蠹(節 錄) 《韓非子》 主講教師:張其昀.
個人簡介 施再繁 台大電機所計算機組博士.
汇报人:李臻 中国海洋大学信息科学与工程学院 计算机科学与技术系
机器人学说话: 深度学习和 信息距离理论 李明, 薄言董事长 宁波信息技术应用研究院首席科学家
手持裝置應用系統之設計 與未來發展 黃有評 大同大學 資訊工程系.
Homework 2 : VSM and Summary
香港有甚麼特色? 我為甚麼欣賞香港? 我們可以怎樣參與本港發展?
姓 名: 刘永鹏 专 业: 计算机应用 指导老师:王宗敏 教授 李润知 讲师
浙江大学CAD&CG国家重点实验室 南京大学多媒体技术研究所 国家体育总局体育科学研究所
《战国策》:范雎说秦王学习要点 一、《战国策》题解 二、长沙马王堆汉墓简介 三、《范雎说秦王》说明 四、《范雎说秦王》语言角度分析
你的潜能是无限的 ——高三心理辅导.
出口退免税政策解读.
Enhancement Algorithms in Digital Camera
Meal-Assistance Robot
Minimum Spanning Trees
Blind dual watermarking for color images’ authentication and copyright protection Source : IEEE Transactions on Circuits and Systems for Video Technology.
Rate and Distortion Optimization for Reversible Data Hiding Using Multiple Histogram Shifting Source: IEEE Transactions On Cybernetics, Vol. 47, No. 2,February.
Large-Scale Malware Indexing Using Function-Call Graphs
Ericsson Solutions for Intelligent Transport Systems and Solutions
Image Retrieval Based on Fractal Signature
The Principles and technology of Social sciences Information Retrieval
词汇语义资源在中文关系抽取中的应用 报告人:钱龙华 刘丹丹 胡亚楠 钱龙华 周国栋
Xi’an RTVU October 19, 2009 Susan C. Aldridge, PhD
研究、論文、計畫與生活之平衡 演講人:謝君偉 元智大學電機系 2018年11月22日.
Mpeg Family 簡介 第六組 B 呂孟庭 B 廖彥鈞.
第4章 网络互联与广域网 4.1 网络互联概述 4.2 网络互联设备 4.3 广域网 4.4 ISDN 4.5 DDN
使用多級倍壓脈波產生器之新型電荷幫浦 半導體元件研究室 原理與分析 摘要
Step 1. Semi-supervised Given a region, where a primitive event happens Given the beginning and end time of each instance of the primitive event.
交通大學多媒體工程所 多媒體及內容搜尋研究群
緣由 由於積體電路(Integrated Circuit, IC)製造技術的精進,系統設計已由運用個別積體電路功能整合的方式進步至系統晶片(System-on-a-Chip, SoC) 設計的世代。原本分屬不同設計範疇的類比(Analog)積體電路設計與數位(Digital)積體電路設計已經必須同時整合,而進入新的混合訊號(Mixed-Signal)積體電路設計的世代。
報告人:吳家麟教授 資訊網路與多媒體研究所 資訊工程學系暨研究所
第三章 基本觀念 電腦繪圖與動畫 (Computer Graphics & Animation) Object Data Image
Introduction to Multimedia Coding
Location Identification and Vehicle Tracking using VANET(VETRAC)
Source: IEEE Transactions on Image Processing, Vol. 25, pp ,
第二讲 计算机信息检索概述 主要内容: 一 信息检索的基本概念 二 电子资源的概念与类型 三 计算机信息检索系统 四 计算机检索技术.
具通訊傳輸品質認知性之IEEE e網路形成和快速加入演算法設計
Advisor : Prof. Frank Y.S. Lin Presented by Yen-Yi, Hsu
結合空間關係之正交基底Multiple-Instance影像擷取方法
计算机视觉 Computer Vision 北京理工大学 计算机科学与工程系 2006年3月9日 Computer Vision
第三章 基本觀念 電腦繪圖與動畫 (Computer Graphics & Animation) Object Data Image
A high payload data hiding scheme based on modified AMBTC technique
VIDEO COMPRESSION & MPEG
Research 裴澍炜 Shuwei Pei Tel:
Liyun Hu (Public management school Yunnan university)
Performance Evaluation of Capacity Based CoMP
Speaker: Wang,Song-Ferng Advisor: Dr. Ho-Ting Wu 2015/7/6
Highlight in cooperation-branch breakthrough I&S Branch 财年行业突破—冶金行业
系统科学与复杂网络初探 刘建国 上海理工大学管理学院
An Efficient MSB Prediction-based Method for High-capacity Reversible Data Hiding in Encrypted Images 基于有效MSB预测的加密图像大容量可逆数据隐藏方法。 本文目的: 做到既有较高的藏量(1bpp),
BiCuts: A fast packet classification algorithm using bit-level cutting
李允中教授-軟體工程實驗室研究方向 觀點導向之軟體發展(Aspect-Oriented Software Development): 觀點導向軟體開發方法主要源自於重新思考軟體系統的模組化(Modularization)以及關注點分離的概念(Separation of Concerns)。當建構軟體系統功能時,往往會發現到除該功能本身之外,必須還要在這些功能上特別關注其他面向的考量,例如執行效能的面向、元件或模組的再利用性、系統的可靠程度等等。因此,一個軟體系統內,往往存在著這些錯綜交織的面向於軟體開發的
網路模擬技術與應用 授課老師:潘仁義 日期:2014/02/18.
万方数据知识服务平台 论文相似性检测 培训师:何娟
空間關係分類以及相似性量測之 範用結構 A General Framework For Classification and Similarity Measure of Spatial Relationship 研究生:洪宗賢 指導教授:蔣依吾 博士 國立中山大學資訊工程學系.
主講 / Alice Lee 李麗貞 2006 主題二 叫我第一名 主講 / Alice Lee 李麗貞
(二)盲信号分离.
钱炘祺 一种面向实体浏览中属性融合的人机交互的设计与实现 Designing Human-Computer Interaction of Property Consolidation for Entity Browsing 钱炘祺
Reversible Data Hiding in Color Image with Grayscale Invariance
空間關係分類以及相似性量測之 範用結構 A General Framework For Classification and Similarity Measure of Spatial Relationship 研究生:洪宗賢 指導教授:蔣依吾 博士 國立中山大學資訊工程學系.
緣由 由於積體電路(Integrated Circuit, IC)製造技術的精進,系統設計已由運用個別積體電路功能整合的方式進步至系統晶片(System-on-a-Chip, SoC) 設計的世代。原本分屬不同設計範疇的類比(Analog)積體電路設計與數位(Digital)積體電路設計已經必須同時整合,而進入新的混合訊號(Mixed-Signal)積體電路設計的世代。
Homework 2 : VSM and Summary
適用於數位典藏多媒體內容之 複合式多媒體檢索技術
Hybrid fractal zerotree wavelet image coding
Presentation transcript:

以碎形正交基底和時間情境圖為基礎進行之視訊檢索 Video retrieval based on fractal orthogonal bases and temporal graph 阿凡達 研究生:張敏倫 指導教授:蔣依吾博士 國立中山大學資訊工程學系

視訊檢索 關鍵字-檔名 Content based video retrieval(CBVR) 人工定義-見解不同定義有所差別 關鍵字意義不同 Content based video retrieval(CBVR) 傳統方法–影片摘要 缺乏視訊結構上觀點 本論文 視訊結構-時間情境圖 視訊內容-碎形正交基底

Li Gao and Zhu Li, “An Efficient Video Indexing and Retrieval Algorithm Using the Luminance Field Trajectory Modeling,” IEEE Trans. on circuits and systems for video technology, vol. 19, no. 10, p.1566~1570, Oct. 2009. 2009 C.-W. Su, H.-Y. Mark Liao, K.-C. Fan, C.-W. Lin and H.-R. Tyan, ”Motion Flow-Based Video Retrieval,” IEEE Trans. Multimedia, Vol. 9, No. 6, pp. 1193-1201, 2007. 2007 W. Hu, D. Xie, Z. Fu, W. Zeng, and S. Maybank, “Semantic-Based Surveillance Video Retrieval,” IEEE Trans. Image Processing, Vol. 16, No. 4, April 2007 X. Zhu, A. K. Elmagarmid, X. Xue, L. Wu, and Ann Christine Catlin, “InsightVideo: Toward Hierarchical Video Content Organization for Efficient Browsing, Summarization and Retrieval,” IEEE Trans. Multimedia , vol. 7, no. 4, pp. 648~665, Aug. 2005. 2005 影像從人工關鍵字到CBIR 再到 CBVR有下列重點: 時間複雜度極高-分析階段,組織階段,比較(影像序列:如監視影像、或運動影像) 有效果的搜尋 解釋這四篇之意義 – Video retrieval 降低時間複雜度 搜尋時間 提出新的概念 Camera motion

分鏡 關鍵影像擷取 群集 場景 相似性量測 測試序列 K-d Tree N(Q) is the total number of frames in the leaf nodes traversed by Q N is the total number of frames in the database Open Video 無Scene分割 目的:降低搜尋時間 舉例:database裡有10個種類 輸入影片為3種類 只要找三個種類即可

分鏡 關鍵影像擷取 群集 場景 相似性量測 測試序列 Motion-tolerant dissolve detection algorithm[1] and Shot change detection based on the Reynolds transport theorem [2] 以trajectory來取代Key-frame

分鏡 關鍵影像擷取 群集 場景 相似性量測 測試序列 Query-Keyword Multiple object queries Query by sketch Surveillance video

分鏡 關鍵影像擷取 群集 場景 相似性量測 測試序列 Frame Level Similarity Shot Level Similarity Shot-Length Matching Average Color Histogram Matching Camera Motion Matching Key-frame Matching Group Level Similarity Scene Level Similarity Video Level Similarity Open video

依據比率失真度準則進行shot segment並擷取關鍵影像 影片序列輸入 Shot 內變異數達預設比率 N NCut分群 建立時間情境圖 有向圖轉字串 相似性量測: 1. 視訊結構 2. 視訊結構和視訊內容 FOB frame String Video Y HSV粗略分割 字串剖析

依據比率失真度準則進行shot segment並擷取關鍵影像 影片序列輸入 Shot 內變異數達預設比率 N NCut分群 建立時間情境圖 有向圖轉字串 FOB frame String Video Y HSV粗略分割 字串剖析 相似性量測: 1. 視訊結構 2. 視訊結構和視訊內容

HSV粗略分割-降低複雜度 HSV初始分割 影像之HSV histogram 交集定義影像之間相似度 令 為第x張影像之彩色直方圖,影像x與影像y之色彩相似度定義為

擷取關鍵影像 根據失真變異度 每個分鏡選取一張關鍵影像 若分鏡差異失真度大於threshold則分割 2 3 4 5 6 8 9 1 7 2 2 3 4 5 6 8 9 10 11 12 13 1 7 14 2 3 4 5 6 8 9 10 11 12 13 1 7 14

motion compensated current frame reference frame reconstructed frame

Rate- distortion criterion

Rate- distortion criterion

依據比率失真度準則進行shot segment並擷取關鍵影像 影片序列輸入 Shot 內變異數達預設比率 N NCut分群 建立時間情境圖 有向圖轉字串 FOB frame String Video Y HSV粗略分割 字串剖析 相似性量測: 1. 視訊結構 2. 視訊結構和視訊內容

Clustering Using Normalized Cut 每個segment代表節點,邊(edge)上之權重值為 解公式(1)藉由合適特徵值所對應之特徵向量 分群概念 數字涵義

Temporal graph generation 先建立節點 再建立edge 成為有向圖 1 1 2 3 4 2 5 2 6 7 8 9

依據比率失真度準則進行shot segment並擷取關鍵影像 影片序列輸入 Shot 內變異數達預設比率 N NCut分群 建立時間情境圖 有向圖轉字串 相似性量測 FOB frame String Video Y HSV粗略分割 字串剖析

有向圖轉字串- Algorithm [ 0 1 2 6 7 8 9 ] [ 0 1 2 6 7 8 9 [ 2 5 2] ] [ 0 1 2 6 7 8 9 ] [ 0 1 2 6 7 8 9 [ 2 5 2] ] [ 0 1 2 6 7 8 9 [ 2 5 2 [ 2 3 4 2] ] ] [ 0 1 3 4 8 [ 1 2 1] [ 3 5 6 7 4 [ ( 53 45) ] ] ] [ 0 1 3 4 8 [ 1 2 1] [ 3 5 6 7 4 ] ] [ 0 1 3 4 8 [ 1 2 1] ] [ 0 1 3 4 8 ]

依據比率失真度準則進行shot segment並擷取關鍵影像 影片序列輸入 Shot 內變異數達預設比率 N NCut分群 建立時間情境圖 有向圖轉字串 FOB frame String Video Y HSV粗略分割 字串剖析 相似性量測: 1. 視訊結構 2. 視訊結構和視訊內容

相似性量測-視訊結構 利用edit-distance對兩string的主結構字串做相似性量測 single node 有結構node (n-1)/n 1

Edit Distance To find a smallest edit process between two strings. S1: TAGTCAC G S2: AG ACTGTC Operation: DMMDDMMIMII

0 1 2 12 [2 11 2 [ 2 3 2 [ 2 8 9 10 2 [ 2 4 5 6 7 2 ] ] ] ]

University of Maryland, College of Information Studies 影片名稱 時間 種類 影像數 關鍵影像數 出處 New Indians, Segment 02 00:03:28 Documentary 6231 10 University of Maryland, College of Information Studies NASA 25th Anniversary Show, Segment 01 00:03:30 6414 13 NASA 25th Anniversary Show, Segment 03 00:02:22 4718 22 The Colorado, segment 01 of 10 00:03:13 6164 7 Carnegie Mellon University, Informedia Project A New Horizon, segment 05 of 13 00:01:59 4046 17 Bor 00:01:06 Public Service 1989 JHUCCP Drift Ice as a Geologic Agent, segment 7 of 11 00:01:05 1920 11 , Informedia Project Drift Ice as a Geologic Agent, segment 10 of 11 00:03:46 1380 Family Planning TV Spots Around the World: Kyrgyzstan 00:01:14 2442 15 How Water Won the West, segment 03 of 8 00:01:25 2805 19 New Indians, Segment 14 00:01:43 3399 16 NASAKSNN - How Do Space Shuttles Blast Off 00:00:30 Educational 902 6 NASA New Indians, Segment 111 00:01:02 1860 14 of , Studies Senses And Sensitivity, Introduction to Lecture 1 presenter 00:02:20 Lecture 4620 25 University of North Carolina at Chapel Hill, Interaction Design Lab The Voyage of the Lee 00:01:15 2272 12 Geological Survey New Indians, Segment 12 00:02:42 5346 21 NASA Connect - ISS - Space Station Parts 00:04:25 8745 31

視訊結構

碎形正交基底(FOB) 相似影像有相似碎形函數; 相似歸結圖有相似碎形函數; 兩碎形函數不相似,其歸結圖亦不相似; 兩影像不相似,其碎形函數亦不相似; 先敘述四個重點證明 碎形的兩個缺點 FOB簡介 不再由單一個,而是由複數個block線性組合,例如8*8 block 就由64個線性組合 64個區塊式訓練出來的 由一張高複雜度的圖形訓練得來 ,且每個區塊是正交

相似性量測-視訊結構和視訊內容 利用edit-distance對兩string主結構計算互相之distance single node 0+ (n-1)/n+1/n* 1 因此比需修正 Fob(I,J) 0 代表像 fob(I,j) 1 代表不像 1. Single 與 single 結構性距離 為0,但是fob算出來的數值,不見得為0

視訊結構和視訊內容 0 1 2 12 [2 11 2 [ 2 3 2 [ 2 8 9 10 2 [ 2 4 5 6 7 2 ] ] ] ]

0 1 [ 1 2 3 1 [ 3 4 3 ] ]

視訊結構

視訊結構和視訊內容

結論與未來展望 結論 分群準則-影響時間情境圖 時間複雜度-視訊結構和視訊內容 未來展望 依個人喜好建立個人化之影片類別 降低計算時間

報告完畢 謝謝