張智星 jang@cs.nthu.edu.tw http://www.cs.nthu.edu.tw/~jang 清大資工系多媒體檢索實驗室 MATLAB 程式設計入門篇通用運算式張智星 jang@cs.nthu.edu.tw http://www.cs.nthu.edu.tw/~jang 清大資工系.

Slides:

Advertisements

Similar presentations

开远市第一中学 2014年高考志愿填报指导会 2014年6月26日.

Advertisements

說劍《莊子‧雜篇》─ 第一組賴泊錞謝孟儒張維真羅苡芸

第六章承銷制度 6.1 前言 6.2 證券承銷商功能 6.3 承銷價格決定方式 6.4 須辦理公開承銷之案件 6.5 承銷之配售方式

必修2 第一单元古代中国经济的基本结构和特点

報告人：教育部會計處處長黃永傳日期：103 年12 月27 日

報告者:蕭曄鴻班級:溫馨甲孝指導教授:李開濟博士

这是一个数字的乐园这里埋藏着丰富的宝藏请跟我一起走进数学的殿堂.

MATLAB 程式設計時間量測清大資工系多媒體資訊檢索實驗室.

單元名稱：健康的兩性交往.

主題─ 悌授課教師：謝宛琳.

張智星 (Roger Jang) 台大資工系多媒體檢索實驗室

2011年10月31日是一个令人警醒的日子,世界在10月31日迎来第70亿人口。当日凌晨,成为象征性的全球第70亿名成员之一的婴儿在菲律宾降生。？

第九课时二元一次方程组　.

張智星台大資工系多媒體檢索實驗室第十章通用表示法張智星台大資工系多媒體檢索實驗室.

七（7）中队读书节韩茜、蒋霁制作.

中國古典文獻學主講：羅積勇教授.

初级会计实务第八章产品成本核算主讲人：杨菠.

休閒二乙4A1B0030 陳唯玲休閒二乙4A1B0020 吳嘉雯休閒二乙4A1B0040 徐巧恩指導老師：柯玲玫

孤獨台灣民謠-莫斯科交響樂團-春天那愷這呢寒.

中考阅读复习备考交流西安铁一中分校向连吾.

忠孝國小自立午餐老師的叮嚀教師指導手冊.

专题20 现代生物进化理论.

岳阳市教学竞赛课件勾股定理授课者赵真金.

我国的宗教政策第七课第三框.

中央广播电视大学开放教育成本会计（补修）期末复习

人教版义务教育课程标准实验教科书小学数学四年级上册第七单元《数学广角》合理安排时间 248.

初中《思想品德》课程改革回顾·现状·展望

第三单元发展社会主义民主政治.

安全系着你我他安全教育知识竞赛.

3.3 资源的跨区域调配 ——以南水北调为例铜山中学李启强.

“08高考化学学业水平（必修科目）测试的命题和教学对策研究”

中考语文积累永宁县教研室步正军 2015．9.

宜蘭縣南北雙港計畫簡報單位：農業局中華民國96年1月29日 1.

课标教材下教研工作的实践与思考山东临沂市教育科学研究中心郭允远.

小学数学知识讲座应用题.

勾股定理说课人：钱丹.

我理想中的职业 ———歌手徐培馨小组.

倒装句之其他句式.

Chapter 5 迴圈.

第 22 课孙中山的民主追求 1 ．近代变法救国主张的失败教训： “师夷之长技以制夷”“中体西用”、兴办洋务、变法维新等的失败，使孙中山

正規表示式 Regular Expression

MATLAB 程式設計通用運算式.

String C語言-字串.

生物資訊程式語言應用 Part 3 Perl Language.

人教版数学四年级（下）乘法分配律单击页面即可演示.

第六章　安全衛生工作守則 6-1　前　言　6-2　訂定依據相關法令規定　6-3　工作守則製作程序及製作前應注意事項　6-4　如何訂定適合需要之安全衛生工作守則　6-5　結　論.

UpToDate Anywhere 設定方法

一元一次方程式的意義一元一次方程式的解等量公理與移項法則自我評量.

JAVA 程式設計資訊管理系 - 網路組.

第一次Labview就上手參考書籍： LabVIEW for Everyone (Jeffrey Travis/Jim Kring)

張智星清大資工系多媒體檢索實驗室 Tree Net Construction 張智星清大資工系.

挑戰C++程式語言 ──第8章進一步談字元與字串

視覺大挑戰吉米李.

挑戰C++程式語言 ──第7章輸入與輸出.

平面向量的坐标运算.

函數應用(二)與自定函數.

Scratch：動畫或遊戲編程任務10:尋找小鬼.

國立台灣大學關懷弱勢族群電腦課程 By 資訊工程黃振修

What is “this”? 在物件導向程式設計中，類別的定義就是在說明如果創建了“這個物件”的話，它會具有那些屬性與功能，以及這些功能是如何實現的。而所謂的“這個物件”就以 this 來表示。當我們在JavaScript與jQuery中寫 script 程式(函式)時，“誰”呼叫這個函式，這個“誰”就是該函式中所謂的.

第四組停車場搜尋系統第四組溫允中陳欣暉蕭積遠李雅俐.

ABAP Basic Concept (2) 運算子控制式與迴圈 Subroutines Event Block

String類別在C語言中提供兩種支援字串的方式可以使用傳統以null結尾的字元陣列使用string類別

畢氏定理(百牛大祭)的故事張美玲製作資料來源：探索數學的故事（凡異出版社）.

30 歲前一定要做的21件事.

大綱: 比例線段定義平行線截比例線段性質顧震宇台灣數位學習科技股份有限公司

成本會計在決策中的功能第四課 1.

102年人事預算編列說明邁向頂尖大學辦公室製作.

ABAP Basic Concept (2) 運算子控制式與迴圈 Subroutines Event Block

Presentation transcript:

張智星 jang@cs.nthu.edu.tw http://www.cs.nthu.edu.tw/~jang 清大資工系多媒體檢索實驗室 MATLAB 程式設計入門篇通用運算式張智星 jang@cs.nthu.edu.tw http://www.cs.nthu.edu.tw/~jang 清大資工系多媒體檢索實驗室

4-1 通用運算式的基本介紹通用運算式（Regular Expressions）最早出現在 UNIX 的文字編輯程式，例如 ed、vi ，也常被用在以 UNIX 為基礎的程式語言，例如 Perl 等。近年來在 Web 上使用的 JavaScript / JScript 以及 VBScript 也加入了通用運算式的功能。通用運算式的終極目標就是「用簡單的符號來代表複雜的字串，以便進行特定字串的比對、代換及抽取」。

4-2 通用式的基本用法使用 regexp 指令比對字串，可找出某一個特定型態的字串在另一個字串的出現位置。例如，如果要找出「love」在一個字串「Love me tender, love me sweet, never let me go」出現的位置，可用下列程式碼：範例4-1： regExp01.m 回傳結果為： startIndex = 17 代表「love」在 string 變數所出現的位置是 17。 string = 'Love me tender, love me sweet, never let me go'; pattern = 'love'; startIndex = regexp(string, pattern)

4-2 通用式的基本用法若要進行「大小寫均可」（Ignore Cases）的比對，則可以使用 regexpi 指令：範例4-2： regExp02.m 回傳結果為：startIndex = 1 17 代表「Love」和「love」在 string 變數所出現的位置分別是 1 和 17。 string = 'Love me tender, love me sweet, never let me go'; pattern = 'love'; startIndex = regexpi(string, pattern)

4-3方括弧的使用我們可以使用方括弧（[]）來列舉所要比對的字元，可見下列範例：範例4-4： regExp10.m string = 'I bet there is a bat on the boat'; pattern = 'b[aeiou]t'; [start, finish] = regexp(string, pattern); fprintf('Matched substrings:\n'); for i=1:length(start) % 列印出比對結果 fprintf('\t%d: %s\n', i, string(start(i):finish(i))); end 回傳結果為：Matched substrings: 1: bet 2: bat

4-3方括弧的使用有關方括弧的使用，我們在下面做一個列表整理與說明：通用式說明及範例比對不成立之字串 [13579] 包含 "1" 或 "3" 或 "5" 或 "7" 或 "9" 的字串，例如："a3b", "1xy" "y2k" [0-9] 含數字之字串不含數字之字串 [a-z0-9] 含數字或小寫字母之字串不含數字及小寫字母之字串 [a-zA-Z0-9] 含數字或字母之字串不含數字及字母之字串 b[aeiou]t "bat", "bet", "bit", "bot", "but" "bxt", "bzt" [^0-9] 不含數字之字串（若要比對 ^，請使用 \^） [^aeiouAEIOU] 不含母音之字串（若要比對 ^，請使用 \^）含母音之字串 [^\^] 不含 "^" 之字串，例如 "xyz", "abc" "xy^", "a^bc"

4-4 特定字元有些通用式會常被用到，因此已被定義為特定字元，以簡化整體通用式，這些字元可列表說明如下：通用式的特定字元說明等效的通用式 \d 數字 [0-9] \D 非數字 [^0-9] \w 數字、字母、底線 [a-zA-Z0-9_] \W 非 \w [^a-zA-Z0-9_] \s 空白字元 [ \r\t\n\f] \S 非空白字元 [^ \r\t\n\f] . 任一個字元，但不包含換行字元（\n）無

4-4 特定字元我們可以用「\d」來比對由 0 到 9 的數字，並用「\D」來比對非數字。假設我們要找出「兩個非數字夾一個數字」的子字串，可使用「\D\d\D」。範例4-7： regExp04.m string = 'Some terms: RU486, Y2K, 900GHz, B2B, B2C'; pattern = '\D\d\D'; [start, finish] = regexp(string, pattern); fprintf('Matched substrings:\n'); for i=1:length(start) fprintf('\t%d: %s\n', i, string(start(i):finish(i))); end 回傳結果為： Matched substrings: 1: Y2K 2: B2B 3: B2C

4-5 定位符號在通用式裡，最常用的定位符號就是 ^ 和 $，其中 ^ 代表一個字串的開始位置，因此 ^xy 代表「以 xy 開始的字串」；而 $ 代表一個字串的結束位置，因此 xy$ 「代表以 xy 結束的字串」。範例4-9： regExp14.m str1 = 'Chapter 5 is my favorite'; str2 = 'I like Chapter 2'; pat = '^Chapter'; fprintf('regexp(''%s'', ''%s'') = %d\n', str1, pat, regexp(str1, pat)); fprintf('regexp(''%s'', ''%s'') = %d\n', str2, pat, regexp(str2, pat)); 回傳結果為： regexp('Chapter 1 is my favorite', '^Chapter') = 1 regexp('I like Chapter 1', '^Chapter') =

4-5 定位符號以下是對於定位符號的列表與整理：通用式說明及範例比對不成立之字串 ^xy 以 "xy" 開始的字串，例如 "xyz", "xyab" （若要比對 ^，請使用 \^） "axy", "bxy" xy$ 以 "xy" 結尾的字串，例如 "axy", "abxy" （若要比對 $，請使用 \$） "xya", "xyb"

4-6 字元與字串的重複我們也可定義字元的重複次數，整理如下：正規表示法說明 a? 零或一個 a （若要比對? 字元，請使用 \?） a.{5}b a 和 b中間夾五個（非換行）字元

4-6 字元與字串的重複使用上表與字元重複次數相關的特殊符號，我們可以從字串「I like Chapter 2, Chapter 10, and Chapter 25 of this book!」抓出「Chapter 2」、「Chapter 10」，以及「Chapter 25」範例4-10： regExp08.m string = 'I like Chapter 2, Chapter 10, and Chapter 25 of this book!'; pattern = 'Chapter [1-9][0-9]?'; [start, finish] = regexp(string, pattern); fprintf('Matched substrings:\n'); for i=1:length(start) fprintf('\t%d: %s\n', i, string(start(i):finish(i))); end 回傳結果為：Matched substrings: 1: Chapter 2 2: Chapter 10 3: Chapter 25

4-7 選項與小括弧的使用如果同時比對數個通用式，可使用「|」來他們串起來，而達到「或」（OR）的邏輯運算效果。如，我們可同時比對信用卡號碼、身份證字號、電話號碼。範例4-16： regExp16 .m string = '1234-5678-9012-3456 and A123456789 and 5715131'; pattern = '\d{4}-\d{4}-\d{4}-\d{4}|[A-Z]\d{9}|\d{7}'; [start, finish] = regexp(string, pattern); fprintf('Matched substrings:\n'); for i=1:length(start) fprintf('\t%d: %s\n', i, string(start(i):finish(i))); end 回傳結果為：Matched substrings: 1: 1234-5678-9012-3456 2: A123456789 3: 5715131

4-7 選項與小括弧的使用小括弧還有一個非常重要的功能，就是可以將對應於小括弧的子字串傳回來，非常適用於特定子字串的抽取。範例4-18： regExp20 .m string = 'I bet there is a bat on the boat'; pattern = 'b(\w*)t'; [start, finish, token] = regexp(string, pattern); fprintf('There are %d matched substrings:\n', length(start)); for i=1:length(start) fprintf('\t%d: matched="%s", token="%s"\n', i, string(start(i):finish(i)), string(token{i}(1):token{i}(2))); end 回傳結果為：There are 3 matched substrings: 1: matched="bet", token="e“ 2: matched="bat", token="a" 3: matched="boat", token="oa" 在上例中，token 就是由 b 和 t 所夾的字串。

4-8 字串的代換利用通用式來進行字串的代換，主要的指令是 regexprep。如，若要將所有「b 和 t 中間至少夾一個母音」的字串代換為 xxx。範例4-21： regExpRep01 .m str = 'I bet there is a bat in the boat!'; pat = 'b[aeiou]+t'; newStr = regexprep(str, pat, 'xxx'); fprintf('%s\n', newStr); 回傳結果為： I xxx there is a xxx in the xxx!