人機介面 Character Recognition 文字辨識

Slides:

Advertisements

Similar presentations

桂林市 2011 年高三第二次调研考试质量分析暨备考教学建议桂林市教育科学研究所李陆桂. 二调平均分与一调、 2010 广西高考英语平均分的比较科目类别英语文科文科 2010 年广西一调二调与 10 年广西相差

Advertisements

新高中中國語文選修單元一︰名著及改編影視作品

智慧型感測器產業概況.

Ch.16 運輸科技 16-1 運輸工具 16-2 智慧型運輸系統 16-3 物流系統.

新編多元性向測驗測驗說明輔導室

國中多元進路簡報主講：陳裕宏( ) 現職：木柵高工教務主任學歷：1.國立台灣師範大學工業教育系(畢業)

Presented By: 王信傑 Ricky Wang Date:2010/10/6

高中研究性学习简介九江三中科研处: 曹荣星 2011、5、20.

在《命运交响曲》音乐声中安静我们的心迎接挑战.

新课程中的教与学让学生在自主· 合作· 探究学习中成长肖川北京师范大学.

參考資料：﹝升中全接觸﹞ 香港明愛青少年及社區服務

专题八书面表达.

101年國中畢業生多元進路宣導國中部註冊組 100年10月29日.

高中職優質化專題教育研究博士班二年級游宗輝.

关于在宝钢全体党员中开展“学党章党规、学系列讲话，做合格党员”学习教育的实施方案

海星國中部直升方案說明報告人：教務處陳博文主任

高中第二群組 1.北一女中~ 2.中山女中~ 3.政大附中~.

101年度十二年國民基本教育國民中學校長專業研習校長落實補救教學、適性輔導中輟生的預防與復學輔導之實務作為

汇报人：李臻中国海洋大学信息科学与工程学院计算机科学与技术系

班級：行流四甲組員：497D0004何筱瑩 497D0016鄧宜欣 497D0044呂亭儀 497D0056黃琪 497D0063賴依淩

歡迎各位老師蒞校參訪召集人、各位委員、同仁大家好，我是林淑玟，負責教務行政進行簡報報告人：林淑玟中華民國九十九年三月二十三日.

大學甄選入學選填志願輔導說明會曾文農工輔導室.

一所具有悠久歷史與優良傳統的優質學校強調生活教育與精緻教學是您有心向學的最佳選擇.

國立嘉義高級工業職業學校 101年度綜合高中宣導研習國立嘉義高工教務主任林章明

新闻发布会.

海軍軍官學校士官二專班招生簡報、第1頁，共30頁.

海軍軍官學校士官二專班 103學年度招生簡報.

院長：鄭錦聰教授各系負責老師光電系：姬梁文老師電機系：張凱雄老師資工系：謝仕杰老師電子系：陳柏宏老師

看图找关系.

网络信息资源的开发与设计主讲教师罗双兰广西师范大学教育科学学院.

我的過動人生圖.文: 吳沁婕.

初高中历史课程衔接 ♣ 深圳中学朱红.

学习雷锋好榜样 ——高一年12班主题班会.

決策分析研究室巫沛倉劉浩天胡承方義守大學工業工程與管理學系.

中学生心理健康讲座打开心灵之门开启阳光之路主讲人：范荃.

行動終端應用軟體創作專題競賽參賽主題：具備車牌辨識功能的快速得來速服務學校單位：國立雲林科技大學電機工程系參賽隊名：ESoC

寻找进口商监测竞争对手提升企业竞争力

教育部宣導專員國立臺中家商許敏政主任 101年2月23日製作 #201~203

報告人：丁英智資策會網路多媒體研究所 11/3/2006

汇报人：王晓东单位：信息科学与工程学院日期：2016年9月

2010電資院「頂尖企業暑期實習」經驗分享心得報告

Tesseract OCR 資科四李昱安.

人機介面 Character Recognition 文字辨識

研究、論文、計畫與生活之平衡演講人：謝君偉元智大學電機系 2018年11月22日.

信息的加工之字处理复习.

教會建堂計劃 Church Building Project

第四章古籍文本的采集扫描技术. 第四章古籍文本的采集扫描技术扫描仪扫描仪是电脑的一种输入设备，它根据光电转换原理将图片、照片、胶片以及文稿资料等书面材料或实物的外观扫描后输入到电脑。扫描仪作为光电、机械一体化的高科技产品，自问世以来以其独特的数字化“图像”采集能力，低廉的价格以及优良的性能，得到了迅速的发展和广泛的普及。

人機介面 Pen-Based Interface 筆跡介面

熊貓鐵金剛 Character Introduction by Animation International.

新書通報 ABOUT THE BOOK ：台灣老年醫學會會員限定方案訂購方法

VIDEO COMPRESSION & MPEG

「鬧熱」的七月祭典.

十二年國民基本教育 103學年度高中高職及五專入學方式與就學區規劃（草案諮詢稿）

Yale World Youth Economic Forum

表情识别研究 Sources of facial expressions

南台科技大學多媒體與電腦娛樂科學系助理教授黃信夫

Highlight in cooperation-branch breakthrough I&S Branch 财年行业突破—冶金行业

高中職多元進路家長說明會主講人: 東莞台商子弟學校麥馨月日期:

Create and Use the Authorization Objects in ABAP

5/15/2019 姓名：公司名称：云赛空间BP模板 Now let’s take a look at who we are, what we’re doing and why we’re doing it in China... This is an image of a technology.

澳洲英語授課暑期研習分享: 參與研習對於大學教師國際觀之影響

An Quick Introduction to R and its Application for Bioinformatics

Speaker : YI-CHENG HUNG

國立嘉義高級工業職業學校 101年度雲嘉區綜合高中宣導研習國立嘉義高工綜高高中學務組長呂明欣

PR-620投资指南Ⅱ 成功从这里起步加入brother团队经营您的绣花生意.

99年基測暨直升、原藝班、申請、甄選入學報名作業說明

阶段性词汇训练3 上海海事大学信息工程学院.

臺灣北區102學年度高級中等學校舞蹈班暨聯合甄選入學術科測驗暨甄選入學說明會

台中市黎明國中105學年度學生報考一般智能暨學術性向資賦優異學生鑑定報名流程說明

Presentation transcript:

人機介面 Character Recognition 文字辨識開課單位授課教師

文字辨識處理項目種類印刷體手寫體方法線上立即辨識非即時辨識

印刷體透過電腦等數位產品產生的字型優點同種字型有一定的規律較工整、美觀缺點種類過多需有特定工具，便利性不足

手寫體經由手使用滑鼠、繪圖筆、文具等方式產生的文字優點可自行變化有筆就可產生缺點文字位置及大小較不固定寫法不同造成辨識困難

線上立即辨識通常用於手機或平板電腦上為邊寫邊辨識優點缺點輸入直覺，符合平日習慣每筆畫皆會判斷一次可利用的資訊較多，辨識容易需在特定區域輸入一次僅能輸入一個字

非即時辨識通常用於手機或電腦等具有相機功能的裝置上，非邊寫邊辨識優點缺點隨拍即用一次辨識很多字可擴充多種應用準確率較低必須有裝置搭配

文字辨識系統分類光學文字辨識系統(Optical Character Recognition) 處理掃描後文件資料的圖檔，對圖檔上的印刷體、手寫體等進行辨識並分析文件內容的系統智慧型字元辨識系統(Intelligent Character Recognition) 針對手寫辨識，處理不同字型及書寫風格，此外在辨識時系統也會繼續學習已增加自己的準確率

應用實例概觀由於線上立即辨識是記錄一筆一畫以及書寫的文字結構資訊，因此手寫體通常搭配線上立即辨識作為一套系統手寫體也會搭配非即時辨識，但由於字體較無完整結構比例，因此辨識難度會增加印刷體則搭配非即時辨識作為一套系統

應用實例:n詞酷屬於手寫體結合線上立即辨識類結合翻譯功能

應用實例:iacces 屬於手寫體結合線上立即辨識類應用於iPhone,iPod touch,iPad

應用實例:World dictionary 屬於印刷體結合非即時辨識類結合翻譯功能並立即顯示在畫面上可翻譯多種語言

應用實例:Pleco 屬於印刷體結合非即時辨識類結合翻譯功能及字典功能

應用實例:Orderfood 屬於印刷體結合非即時辨識類應用於食物招牌辨識

應用實例:蒙恬名片王屬於印刷體結合非即時辨識類有直接掃描名片及利用拍照分析等應用

光學文字辨識技術流程 Preprocessing Segmentation Image Input System Use Recognition Feature Extraction

光學文字辨識技術解析影像輸入(Image Input) 利用手機相機拍攝或電腦視訊攝影機拍攝照片或使用數位相機拍照後輸入

光學文字辨識技術解析前處理(Preprocessing) 進行文字區域的選擇將來源影像非文字部分過濾，移除雜訊常使用基本方法如:灰階後二質化、中值濾波等等

光學文字辨識技術解析文字切割(Segmentation) 將經過前處理後的文字影像句子分解成單一字的圖像圖像輸入二值化後的圖像單一字影像

光學文字辨識技術解析特徵值存取(Feature Extraction) 對每一個單一字影像分別進行特徵值擷取重要的計算資訊文字的架構、外型或像素的方向等 30°

光學文字辨識技術解析文字辨識(Recognition) 使用特徵值的結果作為分類依據一般使用機器學習演算法線性分類器(linear classifiers)，類神經網路(neural networks)，支援向量機(SVM)等等… 不同的演算法會有不同的辨識率，需多嘗試

開發工具: Tesseract OCR (一) 開放原始碼的光學文字辨識軟體支援30種以上的文字/語言能分析整頁文件資料，支援垂直書寫辨識輸入資料須為未經壓縮的標籤圖像文件格式圖檔(TIFF)，背景必須是白色的，但文字則可以是任意色彩

開發工具: Tesseract OCR (二) 分類原理:將字元的邊緣取多邊形逼近，並使用多邊形的水平軸位置、垂直軸位置、方向及長度四維向量作為其特徵值

開發工具: Tesseract OCR (三) 辨識原理:利用先前所獲得的特徵值與已經建立好的文字模型進行比對已取得文字內容

開發工具: Tesseract OCR(四) 成果範例 We‘ve already sorted through the specs, and laid our hands on its rather sexy frame, now Fujiﬁlm'soffering up a more palatable price tag than we expected for its throwback X10 shooter. Startingsometime in early October, the X100's more affordable little brother will set nostalgic point-and-shooters back $599.99 — about $100 bones less than the estimated $715 to $860 ballpark we threw outback in September. If you'll recall, the X10 packs a 12 megapixel EXR CMOS sensor, f/2-2.8, 28-112mmmanual zoom lens, up to 12,800 ISO sensitivity, 1080p video, an optical viewﬁnder, and pop-up ﬂash. Noword yet on a ﬁnal release date. Full PR after the break.

References http://en.wikipedia.org/wiki/Optical_character_recognition http://code.google.com/p/tesseract-ocr/ HuayuNavi: A Mobile Chinese Learning Application Based on Intelligent Character Recognition, Jen-Ho Kuo, Cheng-Ming Huang, Wen-Hung Liao and Chun-Chieh Huang, Proceedings of the 6th International Conference on E-Learning and Games (Edutainment 2011), Sep. 2011.