人機介面 Character Recognition 文字辨識

Slides:



Advertisements
Similar presentations
Ch.16 運輸科技 16-1 運輸工具 16-2 智慧型運輸系統 16-3 物流系統.
Advertisements

高中研究性学习简介 九江三中科研处: 曹荣星 2011、5、20.
汇报人:李臻 中国海洋大学信息科学与工程学院 计算机科学与技术系
2012資電科技寒假營 機器視覺與影像處理 助教:許原彰.
学习雷锋好榜样 ——高一年12班主题班会.
決策分析研究室 巫沛倉 劉浩天 胡承方 義守大學工業工程與管理學系.
TQC+ JAVA全國教師研習會 PLWeb 程式設計練習平台 簡介.
行動終端應用軟體創作專題競賽 參賽主題: 具備車牌辨識功能的快速得來速服務 學校單位:國立雲林科技大學電機工程系 參賽隊名:ESoC
寻找进口商 监测竞争对手 提升企业竞争力
人機介面 Character Recognition 文字辨識
主題五 CPU Learning Lab.
計算機概論 蘇木春 中央大學資工系.
2010電資院 「頂尖企業暑期實習」 經驗分享心得報告
Tesseract OCR 資科四 李昱安.
VC-B20U 高解析USB攝影機.
第一篇 Unix/Linux 操作介面 第 1 章 Unix/Linux 系統概論 第 2 章 開始使用 Unix/Linux
第1章 認識Arduino.
研究、論文、計畫與生活之平衡 演講人:謝君偉 元智大學電機系 2018年11月22日.
數位影像處理 Digital Image Processing
What’s New in HTML5.
信息的加工之字处理复习.
安裝JDK 安裝Eclipse Eclipse 中文化
中文字SVG檔製作 利用線上文字產生器 編製者:陳培文
Word與PowerPoint的結合 建功國小 陳旻杰 健行國小 張慧如.
Visual Basic 物件導向程式設計簡介.
OpenID與WordPress使用說明
學生:吳廷皓 指導老師:陳文平 助理教授 高雄應用科技大學電機系網路應用實驗室 農委會林業試驗所六龜分所
第四章 古籍文本的采集 扫描技术. 第四章 古籍文本的采集 扫描技术 扫描仪 扫描仪是电脑的一种输入设备,它根据光电转换原理将图片、照片、胶片以及文稿资料等书面材料或实物的外观扫描后输入到电脑。 扫描仪作为光电、机械一体化的高科技产品,自问世以来以其独特的数字化“图像”采集能力,低廉的价格以及优良的性能,得到了迅速的发展和广泛的普及。
商用軟體 OFFICE 2003.
App Inventor2呼叫PHP存取MySQL
Android App簡介及 App Inventor 2體驗 靜宜大學資管系 楊子青
檔案與磁碟的基本介紹.
第二章 SPSS的使用 2.1 啟動SPSS系統 2.2 結束SPSS系統 2.3 資料分析之相關檔案 2.4 如何使用SPSS軟體.
視覺式體操動作辨識系統 Vision-based Gymnastics Motion Recognition System 學生:顏羽君
人機介面 Pen-Based Interface 筆跡介面
CH03 資訊管理的智慧觀點:技術篇.
網路安全技術 OSI七層 學生:A 郭瀝婷 指導教授:梁明章.
圖片格式簡介 張啟中.
TB-054A  周天穎 編著 儒林圖書公司 發行.
「鬧熱」的七月祭典.
HTML – 超連結與圖片 資訊教育.
表情识别研究 Sources of facial expressions
2011清大電資院學士班 「頂尖企業暑期實習」 經驗分享心得報告 實習企業:工研院 實習學生:電資院學士班 楊博旭.
Colife 現場直播 免註冊快速登入手冊.
期末考.
指導老師:周建興 老師 開發團隊:吳旻翰、池宗諺 淡江大學電機工程學系 2015/12/11
Word – 排版 資訊教育.
Highlight in cooperation-branch breakthrough I&S Branch 财年行业突破—冶金行业
CVPlayer下載及安裝& IVS操作說明
以四元樹為基礎抽取圖片物件特徵 之 影像檢索
利用 EditorConfig 自訂文字編輯器設定
班級:404班 時間:星期二第八節 教師:黃韋欽師
電腦概論考題分析 佛學資訊組 碩一 張榮顯.
Video 影像 (VideoPlayer 影像播放器、Camcorder 錄影機) 靜宜大學資管系 楊子青
流程控制:Switch-Case 94學年度第一學期‧資訊教育 東海大學物理系.
MiRanda Java Interface v1.0的使用方法
座標系統與圖形介面 分子結構的建立.
澳洲英語授課暑期研習分享: 參與研習對於大學教師國際觀之影響
課程時間:星期二下午2:20-5:20 -> 1:20-4:10 ? 授課教師 逄愛君, 辦公室: 資訊系館 417室 先修課程
Speaker : YI-CHENG HUNG
Brief Guide of FrontPage
Chapter 2 影像壓縮簡介.
語音訊號的特徵向量 張智星 多媒體資訊檢索實驗室 清華大學 資訊工程系.
資料擷取與監控應用實務.
非負矩陣分解法介紹 報告者:李建德.
銘鴻電子FPGA影像編輯平台.
Windows Phone Game 行動遊戲開發
NFC (近場通訊, Near Field Communication) 靜宜大學資管系 楊子青
微 處 理 機 專 題 – 8051 C語言程式設計 主題:階乘計算
醫療影像圖檔處理與投影顯示 Project L 指導教授: 東吳大學資訊科學系副教授 鄭為民老師 組員 Java 3D組 - 郭慈芬、李亭瑩
Presentation transcript:

人機介面 Character Recognition 文字辨識 開課單位 授課教師

文字辨識處理項目 種類 印刷體 手寫體 方法 線上立即辨識 非即時辨識

印刷體 透過電腦等數位產品產生的字型 優點 同種字型有一定的規律 較工整、美觀 缺點 種類過多 需有特定工具,便利性不足

手寫體 經由手使用滑鼠、繪圖筆、文具等方式產生的文字 優點 可自行變化 有筆就可產生 缺點 文字位置及大小較不固定 寫法不同造成辨識困難

線上立即辨識 通常用於手機或平板電腦上 為邊寫邊辨識 優點 缺點 輸入直覺,符合平日習慣 每筆畫皆會判斷一次 可利用的資訊較多,辨識容易 需在特定區域輸入 一次僅能輸入一個字

非即時辨識 通常用於手機或電腦等具有相機功能的裝置上,非邊寫邊辨識 優點 缺點 隨拍即用 一次辨識很多字 可擴充多種應用 準確率較低 必須有裝置搭配

文字辨識系統分類 光學文字辨識系統(Optical Character Recognition) 處理掃描後文件資料的圖檔,對圖檔上的印刷體、手寫體等進行辨識並分析文件內容的系統 智慧型字元辨識系統(Intelligent Character Recognition) 針對手寫辨識,處理不同字型及書寫風格,此外在辨識時系統也會繼續學習已增加自己的準確率

應用實例概觀 由於線上立即辨識是記錄一筆一畫以及書寫的文字結構資訊,因此手寫體通常搭配線上立即辨識作為一套系統 手寫體也會搭配非即時辨識,但由於字體較無完整結構比例,因此辨識難度會增加 印刷體則搭配非即時辨識作為一套系統

應用實例:n詞酷 屬於手寫體結合線上立即辨識類 結合翻譯功能

應用實例:iacces 屬於手寫體結合線上立即辨識類 應用於iPhone,iPod touch,iPad

應用實例:World dictionary 屬於印刷體結合非即時辨識類 結合翻譯功能並立即顯示在畫面上 可翻譯多種語言

應用實例:Pleco 屬於印刷體結合非即時辨識類 結合翻譯功能及字典功能

應用實例:Orderfood 屬於印刷體結合非即時辨識類 應用於食物招牌辨識

應用實例:蒙恬名片王 屬於印刷體結合非即時辨識類 有直接掃描名片及利用拍照分析等應用

光學文字辨識技術流程 Preprocessing Segmentation Image Input System Use Recognition Feature Extraction

光學文字辨識技術解析 影像輸入(Image Input) 利用手機相機拍攝或電腦視訊攝影機拍攝照片 或使用數位相機拍照後輸入

光學文字辨識技術解析 前處理(Preprocessing) 進行文字區域的選擇 將來源影像非文字部分過濾,移除雜訊 常使用基本方法如:灰階後二質化、中值濾波等等

光學文字辨識技術解析 文字切割(Segmentation) 將經過前處理後的文字影像句子分解成單一字的圖像 圖像輸入 二值化後的圖像 單一字影像

光學文字辨識技術解析 特徵值存取(Feature Extraction) 對每一個單一字影像分別進行特徵值擷取 重要的計算資訊 文字的架構、外型或像素的方向等 30°

光學文字辨識技術解析 文字辨識(Recognition) 使用特徵值的結果作為分類依據 一般使用機器學習演算法 線性分類器(linear classifiers),類神經網路(neural networks),支援向量機(SVM)等等… 不同的演算法會有不同的辨識率,需多嘗試

開發工具: Tesseract OCR (一) 開放原始碼的光學文字辨識軟體 支援30種以上的文字/語言 能分析整頁文件資料,支援垂直書寫辨識 輸入資料須為未經壓縮的標籤圖像文件格式圖檔(TIFF),背景必須是白色的,但文字則可以是任意色彩

開發工具: Tesseract OCR (二) 分類原理:將字元的邊緣取多邊形逼近,並使用多邊形的水平軸位置、垂直軸位置、方向及長度四維向量作為其特徵值

開發工具: Tesseract OCR (三) 辨識原理:利用先前所獲得的特徵值與已經建立好的文字模型進行比對已取得文字內容

開發工具: Tesseract OCR(四) 成果範例 We‘ve already sorted through the specs, and laid our hands on its rather sexy frame, now Fujifilm'soffering up a more palatable price tag than we expected for its throwback X10 shooter. Startingsometime in early October, the X100's more affordable little brother will set nostalgic point-and-shooters back $599.99 — about $100 bones less than the estimated $715 to $860 ballpark we threw outback in September. If you'll recall, the X10 packs a 12 megapixel EXR CMOS sensor, f/2-2.8, 28-112mmmanual zoom lens, up to 12,800 ISO sensitivity, 1080p video, an optical viewfinder, and pop-up flash. Noword yet on a final release date. Full PR after the break.

References http://en.wikipedia.org/wiki/Optical_character_recognition http://code.google.com/p/tesseract-ocr/ HuayuNavi: A Mobile Chinese Learning Application Based on Intelligent Character Recognition, Jen-Ho Kuo, Cheng-Ming Huang, Wen-Hung Liao and Chun-Chieh Huang, Proceedings of the 6th International Conference on E-Learning and Games (Edutainment 2011), Sep. 2011.