人機介面 Character Recognition 文字辨識

Slides:

Advertisements

Similar presentations

Ch.16 運輸科技 16-1 運輸工具 16-2 智慧型運輸系統 16-3 物流系統.

Advertisements

高中研究性学习简介九江三中科研处: 曹荣星 2011、5、20.

汇报人：李臻中国海洋大学信息科学与工程学院计算机科学与技术系

2012資電科技寒假營機器視覺與影像處理助教：許原彰.

学习雷锋好榜样 ——高一年12班主题班会.

決策分析研究室巫沛倉劉浩天胡承方義守大學工業工程與管理學系.

TQC+ JAVA全國教師研習會 PLWeb 程式設計練習平台簡介.

行動終端應用軟體創作專題競賽參賽主題：具備車牌辨識功能的快速得來速服務學校單位：國立雲林科技大學電機工程系參賽隊名：ESoC

寻找进口商监测竞争对手提升企业竞争力

人機介面 Character Recognition 文字辨識

主題五 CPU Learning Lab.

計算機概論蘇木春中央大學資工系.

2010電資院「頂尖企業暑期實習」經驗分享心得報告

Tesseract OCR 資科四李昱安.

VC-B20U 高解析USB攝影機.

第一篇 Unix/Linux 操作介面第 1 章 Unix/Linux 系統概論第 2 章開始使用 Unix/Linux

第1章認識Arduino.

研究、論文、計畫與生活之平衡演講人：謝君偉元智大學電機系 2018年11月22日.

數位影像處理 Digital Image Processing

What’s New in HTML5.

信息的加工之字处理复习.

安裝JDK 安裝Eclipse Eclipse 中文化

中文字SVG檔製作利用線上文字產生器編製者：陳培文

Word與PowerPoint的結合建功國小陳旻杰健行國小張慧如.

Visual Basic 物件導向程式設計簡介.

OpenID與WordPress使用說明

學生:吳廷皓指導老師:陳文平助理教授高雄應用科技大學電機系網路應用實驗室農委會林業試驗所六龜分所

第四章古籍文本的采集扫描技术. 第四章古籍文本的采集扫描技术扫描仪扫描仪是电脑的一种输入设备，它根据光电转换原理将图片、照片、胶片以及文稿资料等书面材料或实物的外观扫描后输入到电脑。扫描仪作为光电、机械一体化的高科技产品，自问世以来以其独特的数字化“图像”采集能力，低廉的价格以及优良的性能，得到了迅速的发展和广泛的普及。

商用軟體 OFFICE 2003.

App Inventor2呼叫PHP存取MySQL

Android App簡介及 App Inventor 2體驗靜宜大學資管系楊子青

檔案與磁碟的基本介紹.

第二章 SPSS的使用 2.1 啟動SPSS系統 2.2 結束SPSS系統 2.3 資料分析之相關檔案 2.4 如何使用SPSS軟體.

視覺式體操動作辨識系統 Vision-based Gymnastics Motion Recognition System 學生：顏羽君

人機介面 Pen-Based Interface 筆跡介面

CH03　資訊管理的智慧觀點：技術篇.

網路安全技術 OSI七層學生：A 郭瀝婷指導教授：梁明章.

圖片格式簡介張啟中.

TB-054A  周天穎編著儒林圖書公司　發行.

「鬧熱」的七月祭典.

HTML – 超連結與圖片資訊教育.

表情识别研究 Sources of facial expressions

2011清大電資院學士班「頂尖企業暑期實習」經驗分享心得報告實習企業：工研院實習學生：電資院學士班楊博旭.

Colife 現場直播免註冊快速登入手冊.

指導老師：周建興老師開發團隊：吳旻翰、池宗諺淡江大學電機工程學系 2015/12/11

Word – 排版資訊教育.

Highlight in cooperation-branch breakthrough I&S Branch 财年行业突破—冶金行业

CVPlayer下載及安裝& IVS操作說明

以四元樹為基礎抽取圖片物件特徵之影像檢索

利用 EditorConfig 自訂文字編輯器設定

班級：404班時間：星期二第八節教師：黃韋欽師

電腦概論考題分析佛學資訊組碩一張榮顯.

Video 影像 (VideoPlayer 影像播放器、Camcorder 錄影機) 靜宜大學資管系楊子青

流程控制：Switch-Case 94學年度第一學期‧資訊教育東海大學物理系.

MiRanda Java Interface v1.0的使用方法

座標系統與圖形介面分子結構的建立.

澳洲英語授課暑期研習分享: 參與研習對於大學教師國際觀之影響

課程時間：星期二下午2:20-5:20 -> 1:20-4:10 ? 授課教師逄愛君, 辦公室: 資訊系館 417室先修課程

Speaker : YI-CHENG HUNG

Brief Guide of FrontPage

Chapter 2 影像壓縮簡介.

語音訊號的特徵向量張智星多媒體資訊檢索實驗室清華大學資訊工程系.

資料擷取與監控應用實務.

非負矩陣分解法介紹報告者:李建德.

銘鴻電子FPGA影像編輯平台.

Windows Phone Game 行動遊戲開發

NFC (近場通訊， Near Field Communication) 靜宜大學資管系楊子青

微處理機專題 – 8051 C語言程式設計主題：階乘計算

醫療影像圖檔處理與投影顯示 Project L 指導教授：東吳大學資訊科學系副教授鄭為民老師組員 Java 3D組 - 郭慈芬、李亭瑩

Presentation transcript:

人機介面 Character Recognition 文字辨識開課單位授課教師

文字辨識處理項目種類印刷體手寫體方法線上立即辨識非即時辨識

印刷體透過電腦等數位產品產生的字型優點同種字型有一定的規律較工整、美觀缺點種類過多需有特定工具，便利性不足

手寫體經由手使用滑鼠、繪圖筆、文具等方式產生的文字優點可自行變化有筆就可產生缺點文字位置及大小較不固定寫法不同造成辨識困難

線上立即辨識通常用於手機或平板電腦上為邊寫邊辨識優點缺點輸入直覺，符合平日習慣每筆畫皆會判斷一次可利用的資訊較多，辨識容易需在特定區域輸入一次僅能輸入一個字

非即時辨識通常用於手機或電腦等具有相機功能的裝置上，非邊寫邊辨識優點缺點隨拍即用一次辨識很多字可擴充多種應用準確率較低必須有裝置搭配

文字辨識系統分類光學文字辨識系統(Optical Character Recognition) 處理掃描後文件資料的圖檔，對圖檔上的印刷體、手寫體等進行辨識並分析文件內容的系統智慧型字元辨識系統(Intelligent Character Recognition) 針對手寫辨識，處理不同字型及書寫風格，此外在辨識時系統也會繼續學習已增加自己的準確率

應用實例概觀由於線上立即辨識是記錄一筆一畫以及書寫的文字結構資訊，因此手寫體通常搭配線上立即辨識作為一套系統手寫體也會搭配非即時辨識，但由於字體較無完整結構比例，因此辨識難度會增加印刷體則搭配非即時辨識作為一套系統

應用實例:n詞酷屬於手寫體結合線上立即辨識類結合翻譯功能

應用實例:iacces 屬於手寫體結合線上立即辨識類應用於iPhone,iPod touch,iPad

應用實例:World dictionary 屬於印刷體結合非即時辨識類結合翻譯功能並立即顯示在畫面上可翻譯多種語言

應用實例:Pleco 屬於印刷體結合非即時辨識類結合翻譯功能及字典功能

應用實例:Orderfood 屬於印刷體結合非即時辨識類應用於食物招牌辨識

應用實例:蒙恬名片王屬於印刷體結合非即時辨識類有直接掃描名片及利用拍照分析等應用

光學文字辨識技術流程 Preprocessing Segmentation Image Input System Use Recognition Feature Extraction

光學文字辨識技術解析影像輸入(Image Input) 利用手機相機拍攝或電腦視訊攝影機拍攝照片或使用數位相機拍照後輸入

光學文字辨識技術解析前處理(Preprocessing) 進行文字區域的選擇將來源影像非文字部分過濾，移除雜訊常使用基本方法如:灰階後二質化、中值濾波等等

光學文字辨識技術解析文字切割(Segmentation) 將經過前處理後的文字影像句子分解成單一字的圖像圖像輸入二值化後的圖像單一字影像

光學文字辨識技術解析特徵值存取(Feature Extraction) 對每一個單一字影像分別進行特徵值擷取重要的計算資訊文字的架構、外型或像素的方向等 30°

光學文字辨識技術解析文字辨識(Recognition) 使用特徵值的結果作為分類依據一般使用機器學習演算法線性分類器(linear classifiers)，類神經網路(neural networks)，支援向量機(SVM)等等… 不同的演算法會有不同的辨識率，需多嘗試

開發工具: Tesseract OCR (一) 開放原始碼的光學文字辨識軟體支援30種以上的文字/語言能分析整頁文件資料，支援垂直書寫辨識輸入資料須為未經壓縮的標籤圖像文件格式圖檔(TIFF)，背景必須是白色的，但文字則可以是任意色彩

開發工具: Tesseract OCR (二) 分類原理:將字元的邊緣取多邊形逼近，並使用多邊形的水平軸位置、垂直軸位置、方向及長度四維向量作為其特徵值

開發工具: Tesseract OCR (三) 辨識原理:利用先前所獲得的特徵值與已經建立好的文字模型進行比對已取得文字內容

開發工具: Tesseract OCR(四) 成果範例 We‘ve already sorted through the specs, and laid our hands on its rather sexy frame, now Fujiﬁlm'soffering up a more palatable price tag than we expected for its throwback X10 shooter. Startingsometime in early October, the X100's more affordable little brother will set nostalgic point-and-shooters back $599.99 — about $100 bones less than the estimated $715 to $860 ballpark we threw outback in September. If you'll recall, the X10 packs a 12 megapixel EXR CMOS sensor, f/2-2.8, 28-112mmmanual zoom lens, up to 12,800 ISO sensitivity, 1080p video, an optical viewﬁnder, and pop-up ﬂash. Noword yet on a ﬁnal release date. Full PR after the break.

References http://en.wikipedia.org/wiki/Optical_character_recognition http://code.google.com/p/tesseract-ocr/ HuayuNavi: A Mobile Chinese Learning Application Based on Intelligent Character Recognition, Jen-Ho Kuo, Cheng-Ming Huang, Wen-Hung Liao and Chun-Chieh Huang, Proceedings of the 6th International Conference on E-Learning and Games (Edutainment 2011), Sep. 2011.