Presentation is loading. Please wait.

Presentation is loading. Please wait.

Non-exhaustive clustering

Similar presentations


Presentation on theme: "Non-exhaustive clustering"— Presentation transcript:

1 Non-exhaustive clustering
專利分群 Non-exhaustive clustering 工工系 謝皓娟

2 動機與目標 動機: 由於,專利文件有許多欄位,不一定以整份文件 去做分群的結果是最好的。 United States Patent
7,502,510 Miyoshi ,   et al. March 10, 2009 Title Abstract Inventors Appl. No. Assignee Filed UPC IPC References Cited Claims Images Description

3 動機與目標 將相同的專利文件,以 (1) title + abstract (2) claim (3) description
去做分群,看哪種類型的結果最為適當

4 分群前處理---關鍵字關聯性運算 TEXT MINING: 斷詞 字根還原 停字…… 計算TF-IDF 計算NTF-IDF

5 TF_IDF Term frequency (TF factor):
Measure number of times a word appears in a document IDF factor: Measure number of times the word appears in all document in a set

6 =文件集的總字數

7

8 分群前處理---關鍵字關聯性運算 關鍵字之間的關連性

9 方法論_ Non-exhaustive clustering
Non-exhaustive clustering的方法,是運用 Overlapping Partitioning Cluster (OPC) algorithm依照門檻值來決定資料彼此是否 屬於同一群集。 所以,資料點不一定只屬於一個群集,可 能同時有兩個或兩個以上的群集包含它

10 Non-exhaustive專利分群 將關鍵字之間的距離,轉換成介於0到1之間的相 似程度 (Similarity level)
計算出YN矩陣

11 CRF 為了從t個關鍵字中找出k個關鍵字作為群集中心, CRF值便是用來評估選擇最合適的關鍵字,作為 起始群集中心
Crowding value rowding value ( )表示群集內資料最大化,定義如下: 表示以 為中心點之群集所包含的資料量值, 則代表最大之 ,若 越大,代表以 為群集中心點能將群集內之資料量最大化。 定義為: 表示 與最近的群集中心點之距離,而 表示 與最遠之群集中心點之距離,若 值高代表群集中心點彼此之間的距離較大。

12 CRF

13

14 資料收集_專利檢索 USPTO 專利資料庫 關鍵字: Adtec AND position:26 align AND ORC :10
exposure AND Adtec:14 exposure position AND ORC:12 ORC AND projection optical:2 ORC AND transport:1

15

16 LKM_上傳資料

17

18 TF矩陣

19 NTF矩陣

20 NTF-IDF矩陣

21 前50候選詞彙

22

23 關鍵字關聯性矩陣

24 YN矩陣 select YN_MIN from NON_EXHAUSTIVE_VARIABLE where TYPE = 'KE2'
 select * from (select MIN from NON_EXHAUSTIVE_YNMATRIX where TYPE = ‘KE2’ ORDER BY TO_NUMBER(MIN)) where row num <= 2000 門檻值比例:TOP80.0% 門檻值總數:共2500個 門檻值上限:第2000個 門檻值數值:必須大於0.35

25 YN矩陣

26 關鍵字CRF值

27 OBJcurrent

28 結果_claim_3 第一群 中心詞彙:KP3 exposing stage
同群詞彙:lower printing frame / mask film / exposing apparatus / alignment table / connecting / step / lower frame plate / process / suction / upper printing frame / alignment stage / movable table / mask alignment system / lifted / lightning device / reverse stage / camera / vacuum frame / 

29 結果_claim_3 第二群 中心詞彙:KP37 raising
同群詞彙:pile forming ledge / wherein / severed / pile loops lc / pile loops lu / pattern jacks / arranged / retracting / course / circular knitting machine / stitch / 

30 結果_claim_3 第三群 中心詞彙: 同群詞彙:lower printing frame / exposing stage / exposing apparatus / alignment table / connecting / process / wherein / suction  / upper printing frame / reverse stage / 

31 結果_claim_3

32 結果_description_3 第一群 中心詞彙:KP1 lower printing frame
同群詞彙:transferred / exposing stage / alignment table / alignment stage / shown / upper printing frame / handler / transparent plate / exposing apparatus / reverse stage / feed / delivery table / 

33 結果_description_3 第二群: 中心詞彙:KP47 mounting table
同群詞彙:exposing stage / camera / moving / mask film / alignment table / lower frame plate / alignment stage / shown / alignment operation / mark wm / shear / movable table / mask mark mm / situation / exposing apparatus / plane view / inscribed circle / memorized / circumscribed rectangle / 

34 結果_description_3 第三群: 中心詞彙:KP5 camera
同群詞彙:moving / shown / alignment operation / mark wm / shear / mask mark mm / situation / plane view / inscribed circle / memorized / mounting table / circumscribed rectangle / 

35 結果_description_3

36 結果_claim_4 第一群: 中心詞彙: reverse stage
同群詞彙: lower printing frame / exposing stage / exposing apparatus / alignment table / connecting / process / wherein / suction  / upper printing frame / camera / vacuum frame / 

37 結果_claim_4 第二群: 中心詞彙: suction
同群詞彙: lower printing frame / exposing stage / mask film / exposing apparatus / alignment table / connecting / step / lower frame plate / process / wherein / upper printing frame / alignment stage / movable table / mask alignment system / lifted / lightning device / reverse stage / camera / vacuum frame / 

38 結果_claim_4 第三群: 中心詞彙: wherein
同群詞彙: lower printing frame / table / alignment table / pile forming ledge / connecting / process / suction / severed / up per printing frame / transferring passage / pile loops lc / pile loops lu / pattern jacks / arranged / retracting / apparatus / raising / c onveying / mask / course / circular knitting machine / stitch / reverse stage / camera / vacuum frame / 

39 結果_claim_4 第四群: 中心詞彙: substantially vertical position
同群詞彙: substrate / hold / moving / plurality / 

40 結果_claim_4

41 結果_description_4 第一群 中心詞彙:KP31 plane view
同群詞彙: camera / moving / shown / alignment operation / mark wm / shear / mask mark mm / situation / inscribed circle / memorized / mounting table / circumscribed rectangle / 

42 結果_description_4 第二群 中心詞彙: arc extinguishing capacitor
同群詞彙: capacitive coupling electrode / floating electrode / ozone generator / insulating material / 

43 結果_description_4 第三群 中心詞彙: mounting table
同群詞彙: exposing stage / camera / moving / mask film / alignment table / lower frame plate / alignment stage / shown / alignment operation / mark wm / shear / movable table / mask mark mm / situation / exposing apparatus / plane view / inscribed circle / memorized / circumscribed rectangle / 

44 結果_description_4 第四群 中心詞彙: inscribed circle
同群詞彙: camera / moving / shown / alignment operation / mark wm / shear / mask mark mm / situation / plane view / memorized / mounting table / circumscribed rectangle / 

45 結果_description_4


Download ppt "Non-exhaustive clustering"

Similar presentations


Ads by Google