Non-exhaustive clustering 專利分群 Non-exhaustive clustering 工工系 9534059 謝皓娟
動機與目標 動機: 由於,專利文件有許多欄位,不一定以整份文件 去做分群的結果是最好的。 United States Patent 7,502,510 Miyoshi , et al. March 10, 2009 Title Abstract Inventors Appl. No. Assignee Filed UPC IPC References Cited Claims Images Description
動機與目標 將相同的專利文件,以 (1) title + abstract (2) claim (3) description 去做分群,看哪種類型的結果最為適當
分群前處理---關鍵字關聯性運算 TEXT MINING: 斷詞 字根還原 停字…… 計算TF-IDF 計算NTF-IDF
TF_IDF Term frequency (TF factor): Measure number of times a word appears in a document IDF factor: Measure number of times the word appears in all document in a set
=文件集的總字數
分群前處理---關鍵字關聯性運算 關鍵字之間的關連性
方法論_ Non-exhaustive clustering Non-exhaustive clustering的方法,是運用 Overlapping Partitioning Cluster (OPC) algorithm依照門檻值來決定資料彼此是否 屬於同一群集。 所以,資料點不一定只屬於一個群集,可 能同時有兩個或兩個以上的群集包含它
Non-exhaustive專利分群 將關鍵字之間的距離,轉換成介於0到1之間的相 似程度 (Similarity level) 計算出YN矩陣
CRF 為了從t個關鍵字中找出k個關鍵字作為群集中心, CRF值便是用來評估選擇最合適的關鍵字,作為 起始群集中心 Crowding value rowding value ( )表示群集內資料最大化,定義如下: 表示以 為中心點之群集所包含的資料量值, 則代表最大之 ,若 越大,代表以 為群集中心點能將群集內之資料量最大化。 定義為: 表示 與最近的群集中心點之距離,而 表示 與最遠之群集中心點之距離,若 值高代表群集中心點彼此之間的距離較大。
CRF
資料收集_專利檢索 USPTO 專利資料庫 關鍵字: Adtec AND position:26 align AND ORC :10 exposure AND Adtec:14 exposure position AND ORC:12 ORC AND projection optical:2 ORC AND transport:1
LKM_上傳資料
TF矩陣
NTF矩陣
NTF-IDF矩陣
前50候選詞彙
關鍵字關聯性矩陣
YN矩陣 select YN_MIN from NON_EXHAUSTIVE_VARIABLE where TYPE = 'KE2' select * from (select MIN from NON_EXHAUSTIVE_YNMATRIX where TYPE = ‘KE2’ ORDER BY TO_NUMBER(MIN)) where row num <= 2000 門檻值比例:TOP80.0% 門檻值總數:共2500個 門檻值上限:第2000個 門檻值數值:必須大於0.35
YN矩陣
關鍵字CRF值
OBJcurrent
結果_claim_3 第一群 中心詞彙:KP3 exposing stage 同群詞彙:lower printing frame / mask film / exposing apparatus / alignment table / connecting / step / lower frame plate / process / suction / upper printing frame / alignment stage / movable table / mask alignment system / lifted / lightning device / reverse stage / camera / vacuum frame /
結果_claim_3 第二群 中心詞彙:KP37 raising 同群詞彙:pile forming ledge / wherein / severed / pile loops lc / pile loops lu / pattern jacks / arranged / retracting / course / circular knitting machine / stitch /
結果_claim_3 第三群 中心詞彙: 同群詞彙:lower printing frame / exposing stage / exposing apparatus / alignment table / connecting / process / wherein / suction / upper printing frame / reverse stage /
結果_claim_3
結果_description_3 第一群 中心詞彙:KP1 lower printing frame 同群詞彙:transferred / exposing stage / alignment table / alignment stage / shown / upper printing frame / handler / transparent plate / exposing apparatus / reverse stage / feed / delivery table /
結果_description_3 第二群: 中心詞彙:KP47 mounting table 同群詞彙:exposing stage / camera / moving / mask film / alignment table / lower frame plate / alignment stage / shown / alignment operation / mark wm / shear / movable table / mask mark mm / situation / exposing apparatus / plane view / inscribed circle / memorized / circumscribed rectangle /
結果_description_3 第三群: 中心詞彙:KP5 camera 同群詞彙:moving / shown / alignment operation / mark wm / shear / mask mark mm / situation / plane view / inscribed circle / memorized / mounting table / circumscribed rectangle /
結果_description_3
結果_claim_4 第一群: 中心詞彙: reverse stage 同群詞彙: lower printing frame / exposing stage / exposing apparatus / alignment table / connecting / process / wherein / suction / upper printing frame / camera / vacuum frame /
結果_claim_4 第二群: 中心詞彙: suction 同群詞彙: lower printing frame / exposing stage / mask film / exposing apparatus / alignment table / connecting / step / lower frame plate / process / wherein / upper printing frame / alignment stage / movable table / mask alignment system / lifted / lightning device / reverse stage / camera / vacuum frame /
結果_claim_4 第三群: 中心詞彙: wherein 同群詞彙: lower printing frame / table / alignment table / pile forming ledge / connecting / process / suction / severed / up per printing frame / transferring passage / pile loops lc / pile loops lu / pattern jacks / arranged / retracting / apparatus / raising / c onveying / mask / course / circular knitting machine / stitch / reverse stage / camera / vacuum frame /
結果_claim_4 第四群: 中心詞彙: substantially vertical position 同群詞彙: substrate / hold / moving / plurality /
結果_claim_4
結果_description_4 第一群 中心詞彙:KP31 plane view 同群詞彙: camera / moving / shown / alignment operation / mark wm / shear / mask mark mm / situation / inscribed circle / memorized / mounting table / circumscribed rectangle /
結果_description_4 第二群 中心詞彙: arc extinguishing capacitor 同群詞彙: capacitive coupling electrode / floating electrode / ozone generator / insulating material /
結果_description_4 第三群 中心詞彙: mounting table 同群詞彙: exposing stage / camera / moving / mask film / alignment table / lower frame plate / alignment stage / shown / alignment operation / mark wm / shear / movable table / mask mark mm / situation / exposing apparatus / plane view / inscribed circle / memorized / circumscribed rectangle /
結果_description_4 第四群 中心詞彙: inscribed circle 同群詞彙: camera / moving / shown / alignment operation / mark wm / shear / mask mark mm / situation / plane view / memorized / mounting table / circumscribed rectangle /
結果_description_4