人機介面 Character Recognition 文字辨識

Slides:



Advertisements
Similar presentations
桂林市 2011 年高三第二次调研考 试质量分析暨备考教学建议 桂林市教育科学研究所 李陆桂. 二调平均分与一调、 2010 广西高考英语平均分的比较 科目 类别 英语 文科文科 2010 年广西 一调 二调 与 10 年广西相差
Advertisements

新高中中國語文 選修單元一︰名著及改編影視作品
智慧型感測器產業概況.
Ch.16 運輸科技 16-1 運輸工具 16-2 智慧型運輸系統 16-3 物流系統.
新編多元性向測驗 測驗說明 輔導室
國中多元進路簡報 主講:陳裕宏( ) 現職:木柵高工教務主任 學歷:1.國立台灣師範大學工業教育系(畢業)
Presented By: 王信傑 Ricky Wang Date:2010/10/6
高中研究性学习简介 九江三中科研处: 曹荣星 2011、5、20.
在《命运交响曲》 音乐声中 安静我们的心 迎接挑战.
新课程中的教与学 让学生在自主· 合作· 探究 学习中成长 肖 川 北 京 师 范 大 学.
參考資料:﹝升中全接觸﹞ 香港明愛青少年及社區服務
专题八 书面表达.
101年國中畢業生多元進路宣導 國中部註冊組 100年10月29日.
高中職優質化專題 教育研究博士班二年級 游宗輝.
关于在宝钢全体党员中开展“学党章党规、 学系列讲话,做合格党员”学习教育的 实施方案
海星國中部直升方案說明 報告人:教務處 陳博文主任
高中第二群組 1.北一女 中~ 2.中山女中~ 3.政大附中~.
101年度十二年國民基本教育 國民中學校長專業研習 校長落實補救教學、適性輔導 中輟生的預防與復學輔導之實務作為
汇报人:李臻 中国海洋大学信息科学与工程学院 计算机科学与技术系
班級:行流四甲 組員:497D0004何筱瑩 497D0016鄧宜欣 497D0044呂亭儀 497D0056黃 琪 497D0063賴依淩
歡迎各位老師 蒞校參訪 召集人、各位委員、同仁大家好,我是林淑玟,負責教務行政進行簡報 報告人:林淑玟 中華民國九十九年三月二十三日.
大學甄選入學 選填志願輔導說明會 曾文農工輔導室.
一所具有悠久歷史與優良傳統的 優質學校 強調生活教育與精緻教學 是您有心向學的最佳選擇.
國立嘉義高級工業職業學校 101年度綜合高中宣導研習 國立嘉義高工 教務主任 林章明
新闻发布会.
海軍軍官學校 士官二專班 招生簡報 、 第1頁,共30頁.
海軍軍官學校 士官二專班 103學年度 招生簡報.
院長:鄭錦聰 教授 各系負責老師 光電系:姬梁文老師 電機系:張凱雄老師 資工系:謝仕杰老師 電子系:陳柏宏 老師
看图找关系.
网络信息资源的开发与设计 主讲教师 罗双兰 广西师范大学教育科学学院.
我的過動人生 圖.文: 吳沁婕.
初高中历史课程衔接 ♣ 深圳中学 朱红.
学习雷锋好榜样 ——高一年12班主题班会.
決策分析研究室 巫沛倉 劉浩天 胡承方 義守大學工業工程與管理學系.
中学生心理健康讲座 打开心灵之门 开启阳光之路 主讲人:范荃.
行動終端應用軟體創作專題競賽 參賽主題: 具備車牌辨識功能的快速得來速服務 學校單位:國立雲林科技大學電機工程系 參賽隊名:ESoC
寻找进口商 监测竞争对手 提升企业竞争力
教育部宣導專員 國立臺中家商 許敏政主任 101年2月23日製作 #201~203
報告人:丁英智 資策會 網路多媒體研究所 11/3/2006
汇报人:王晓东 单 位:信息科学与工程学院 日 期:2016年9月
2010電資院 「頂尖企業暑期實習」 經驗分享心得報告
Tesseract OCR 資科四 李昱安.
人機介面 Character Recognition 文字辨識
研究、論文、計畫與生活之平衡 演講人:謝君偉 元智大學電機系 2018年11月22日.
信息的加工之字处理复习.
教會建堂計劃 Church Building Project
第四章 古籍文本的采集 扫描技术. 第四章 古籍文本的采集 扫描技术 扫描仪 扫描仪是电脑的一种输入设备,它根据光电转换原理将图片、照片、胶片以及文稿资料等书面材料或实物的外观扫描后输入到电脑。 扫描仪作为光电、机械一体化的高科技产品,自问世以来以其独特的数字化“图像”采集能力,低廉的价格以及优良的性能,得到了迅速的发展和广泛的普及。
人機介面 Pen-Based Interface 筆跡介面
熊貓鐵金剛 Character Introduction by Animation International.
新書通報 ABOUT THE BOOK : 台灣老年醫學會會員限定方案 訂 購 方 法
VIDEO COMPRESSION & MPEG
「鬧熱」的七月祭典.
十二年國民基本教育 103學年度高中高職及五專 入學方式與就學區規劃 (草案諮詢稿)
Yale World Youth Economic Forum
表情识别研究 Sources of facial expressions
南台科技大學 多媒體與電腦娛樂科學系 助理教授 黃信夫
Highlight in cooperation-branch breakthrough I&S Branch 财年行业突破—冶金行业
高中職多元進路 家長說明會 主講人: 東莞台商子弟學校 麥馨月 日 期:
Create and Use the Authorization Objects in ABAP
5/15/2019 姓名: 公司名称: 云赛空间BP模板 Now let’s take a look at who we are, what we’re doing and why we’re doing it in China... This is an image of a technology.
澳洲英語授課暑期研習分享: 參與研習對於大學教師國際觀之影響
An Quick Introduction to R and its Application for Bioinformatics
Speaker : YI-CHENG HUNG
國立嘉義高級工業職業學校 101年度雲嘉區綜合高中宣導研習 國立嘉義高工 綜高高中學務組長 呂明欣
PR-620投资指南Ⅱ 成功从这里起步 加入brother团队 经营您的绣花生意.
99年基測暨直升、原藝班、 申請、甄選入學報名作業說明
阶段性词汇训练3 上海海事大学信息工程学院.
臺灣北區102學年度高級中等學校 舞蹈班暨聯合甄選入學術科測驗 暨甄選入學說明會
台中市黎明國中105學年度 學生報考 一般智能暨學術性向資賦優異學生鑑定 報名流程說明
Presentation transcript:

人機介面 Character Recognition 文字辨識 開課單位 授課教師

文字辨識處理項目 種類 印刷體 手寫體 方法 線上立即辨識 非即時辨識

印刷體 透過電腦等數位產品產生的字型 優點 同種字型有一定的規律 較工整、美觀 缺點 種類過多 需有特定工具,便利性不足

手寫體 經由手使用滑鼠、繪圖筆、文具等方式產生的文字 優點 可自行變化 有筆就可產生 缺點 文字位置及大小較不固定 寫法不同造成辨識困難

線上立即辨識 通常用於手機或平板電腦上 為邊寫邊辨識 優點 缺點 輸入直覺,符合平日習慣 每筆畫皆會判斷一次 可利用的資訊較多,辨識容易 需在特定區域輸入 一次僅能輸入一個字

非即時辨識 通常用於手機或電腦等具有相機功能的裝置上,非邊寫邊辨識 優點 缺點 隨拍即用 一次辨識很多字 可擴充多種應用 準確率較低 必須有裝置搭配

文字辨識系統分類 光學文字辨識系統(Optical Character Recognition) 處理掃描後文件資料的圖檔,對圖檔上的印刷體、手寫體等進行辨識並分析文件內容的系統 智慧型字元辨識系統(Intelligent Character Recognition) 針對手寫辨識,處理不同字型及書寫風格,此外在辨識時系統也會繼續學習已增加自己的準確率

應用實例概觀 由於線上立即辨識是記錄一筆一畫以及書寫的文字結構資訊,因此手寫體通常搭配線上立即辨識作為一套系統 手寫體也會搭配非即時辨識,但由於字體較無完整結構比例,因此辨識難度會增加 印刷體則搭配非即時辨識作為一套系統

應用實例:n詞酷 屬於手寫體結合線上立即辨識類 結合翻譯功能

應用實例:iacces 屬於手寫體結合線上立即辨識類 應用於iPhone,iPod touch,iPad

應用實例:World dictionary 屬於印刷體結合非即時辨識類 結合翻譯功能並立即顯示在畫面上 可翻譯多種語言

應用實例:Pleco 屬於印刷體結合非即時辨識類 結合翻譯功能及字典功能

應用實例:Orderfood 屬於印刷體結合非即時辨識類 應用於食物招牌辨識

應用實例:蒙恬名片王 屬於印刷體結合非即時辨識類 有直接掃描名片及利用拍照分析等應用

光學文字辨識技術流程 Preprocessing Segmentation Image Input System Use Recognition Feature Extraction

光學文字辨識技術解析 影像輸入(Image Input) 利用手機相機拍攝或電腦視訊攝影機拍攝照片 或使用數位相機拍照後輸入

光學文字辨識技術解析 前處理(Preprocessing) 進行文字區域的選擇 將來源影像非文字部分過濾,移除雜訊 常使用基本方法如:灰階後二質化、中值濾波等等

光學文字辨識技術解析 文字切割(Segmentation) 將經過前處理後的文字影像句子分解成單一字的圖像 圖像輸入 二值化後的圖像 單一字影像

光學文字辨識技術解析 特徵值存取(Feature Extraction) 對每一個單一字影像分別進行特徵值擷取 重要的計算資訊 文字的架構、外型或像素的方向等 30°

光學文字辨識技術解析 文字辨識(Recognition) 使用特徵值的結果作為分類依據 一般使用機器學習演算法 線性分類器(linear classifiers),類神經網路(neural networks),支援向量機(SVM)等等… 不同的演算法會有不同的辨識率,需多嘗試

開發工具: Tesseract OCR (一) 開放原始碼的光學文字辨識軟體 支援30種以上的文字/語言 能分析整頁文件資料,支援垂直書寫辨識 輸入資料須為未經壓縮的標籤圖像文件格式圖檔(TIFF),背景必須是白色的,但文字則可以是任意色彩

開發工具: Tesseract OCR (二) 分類原理:將字元的邊緣取多邊形逼近,並使用多邊形的水平軸位置、垂直軸位置、方向及長度四維向量作為其特徵值

開發工具: Tesseract OCR (三) 辨識原理:利用先前所獲得的特徵值與已經建立好的文字模型進行比對已取得文字內容

開發工具: Tesseract OCR(四) 成果範例 We‘ve already sorted through the specs, and laid our hands on its rather sexy frame, now Fujifilm'soffering up a more palatable price tag than we expected for its throwback X10 shooter. Startingsometime in early October, the X100's more affordable little brother will set nostalgic point-and-shooters back $599.99 — about $100 bones less than the estimated $715 to $860 ballpark we threw outback in September. If you'll recall, the X10 packs a 12 megapixel EXR CMOS sensor, f/2-2.8, 28-112mmmanual zoom lens, up to 12,800 ISO sensitivity, 1080p video, an optical viewfinder, and pop-up flash. Noword yet on a final release date. Full PR after the break.

References http://en.wikipedia.org/wiki/Optical_character_recognition http://code.google.com/p/tesseract-ocr/ HuayuNavi: A Mobile Chinese Learning Application Based on Intelligent Character Recognition, Jen-Ho Kuo, Cheng-Ming Huang, Wen-Hung Liao and Chun-Chieh Huang, Proceedings of the 6th International Conference on E-Learning and Games (Edutainment 2011), Sep. 2011.