Chapter 10 集群分析. Chapter 10 集群分析 概念及應用 集群分析(cluster analysis)是一種用來將屬量的觀測點分群或分類的分析方法 經過集群分析分群之後,在同一群內的觀測點針對某些特性而言,會具有一致性;而分屬不同群的觀測點,針對同樣的特性則會有顯著的不同.

Slides:



Advertisements
Similar presentations
會計學 Chapter 1 基本概念 1-2 基本概念 第一節 單式簿記 第二節 會計學的定義與功用 第三節 會計學術與會計人員 第四節 企業組織 第五節 會計學基本第五節 會計學基本慣例 第六節 會計方程式 第七節 財務報表.
Advertisements

Chapter 5 教育發展與職業選擇. 1. 認識高職學生的生涯進路。 2. 了解個人特質與職業屬性之 間的關係。 3. 認識打工安全與勞動權益。
Hu Junfeng 向量空间模型及 k-means 聚类算法 胡俊峰 2016/04/19. Hu Junfeng 在 Trie 树上合并同词干的词集 — 问题分析 词干 + 后缀 词干 - 词尾变形 + 后缀 后缀表生成 结果评价? 2.
小 王 子 組別:第五組 班級:財金二甲 組員:A 林安潔 A 陳思羽 A 許雅涵
11-1 保險業之定義 11-2 保險業之設立 11-3 保險業之組織 11-4 保險業之營業範圍
第6章 方差分析与试验设计 会计学2011级 主讲:王红娜.
張偉豪 三星統計服務有限公司 執行長 Amos 亞洲一哥
9-1 火災保險 9-2 海上保險 9-3 陸空保險 9-4 責任保險 9-5 保證保險 9-6 其他財產保險
第一节 平均数与标准差的概念 第二节 平均数和标准差在体育中的应用 第三节 百分位数及其应用
Chapter 3 預測.
生物統計與SAS軟體課程教學(三) 雙變項統計分析(一)
景氣循環 景氣循環 美國景氣循環變化歷程 景氣循環面面觀 景氣循環分析的介紹 總體經濟學 chapter 8 景氣循環.
槍砲病菌與鋼鐵 第三組.
99年成語200題庫(21-40).
導覽解說與環境教育 CHAPTER 3 解說員.
財務報表的內容 四種報表格式 財務報表的補充說明 會計師簽證的重要性 合併報表 財務報表分析 Chapter 2 財務報表的內容.
老師 製作 法律與生活.
如何打造学习型团队 主讲:詹琼然 选送单位:重庆市长寿区妇幼保健院 0903NX《中国医院内训师高级研修班》学员.
第十七章休閒農業之經營策略與成功之道 17 Chapter.
Chapter 2 勞工安全衛生法.
第十九章 聯合分析、多元尺度方法 和集群分析
第十章 宏观经济学概论 宏观经济学概论.
美國法上的隱私權(Right to Privacy)與公開權(Right of Publicity):百年發展舉世影響
風險分析與財務結構 瞭解風險的定義與種類 衡量企業風險與財務風險 影響企業風險的因素 影響財務風險的因素 以現金流量衡量企業長期的財務狀況
國際行銷管理 林 建 煌 著.
Chapter 8 Liner Regression and Correlation 第八章 直线回归和相关
第九章 方差分析 讲授内容 方差分析的基本思想及应用条件 完全随机设计资料的方差分析 随机区组设计资料的方差分析 重复测量资料的方差分析
第十七章 SPSS系统在传播学研究中的应用
第一節 知覺 第二節 認知 第三節 學習 第四節 創造力
Analysis of Variance 變異數分析
Chapter 2 簡單迴歸模型.
CHAPTER 2 綜合所得稅之架構.
課程九 迴歸與相關1.
台灣中部地區勞資爭議事件研究 以組織衝突管理論論之 論文解析 指導老師 孫德修教授 第四組 洪美怡 梁正庸.
簡單迴歸模型的基本假設 用最小平方法(OLS-ordinary least square)找到一個迴歸式:
第 13 章 實驗設計與變異數分析.
Test for difference among the means: t Test
预防流感保健康 学校 老师.
本章重點: 一、集中量數的意義和種類 二、算術平均數 三、中位數(中數) 四、眾 數 五、其他集中量數 六、SPSS12.0實務操作
統計量數 集中趨勢量數 離散趨勢量數 相對位置量數 分配形態量數.
主講人 陳陸輝 特聘研究員兼主任 政治大學 選舉研究中心
交叉表格分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2011/7/13.
第五章 聚类方法 内容提要 聚类方法概述 划分聚类方法 层次聚类方法 密度聚类方法 其它聚类方法 2019年2月17日星期日
論文計畫書 國軍人員對廢軍品管理現況之研究─以空軍 後勤單位為例 指導教授:胡子陵博士 研究生:劉俊德.
受欢迎的课堂具有什么特征 课堂观察研究 问卷调查研究
量化研究與統計分析 集群分析 Cluster analysis 謝寶煖 2006年5月27日.
庄文忠 副教授 世新大学行政管理学系 相关分析与简单回归分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2019/4/7.
MyLibrary ——数字图书馆的个性化服务
第3章 預測 2019/4/11 第3章 預測.
抽樣分配 Sampling Distributions
日光燈製造業 勞工汞蒸氣暴露評估技術探討 勞工安全衛生研究所 謝俊明 林雲卿 4/18/2019.
課程十 迴歸3.
老師 製作 休閒農場.
第17章 集群分析 本章的學習主題  1. 集群分析的概念 2. 相似性及最近距離的衡量 3. 階層分析法 4. 非階層分析法
聚类分析法预测(Cluster Analysis)
心理學—日常生活中的應用 人際溝通.
社会研究方法 第7讲:社会统计2.
第二部分:统计推断 Chp6:统计推断概述 Chp7:非参数推断 Chp8:Bootstrap Chp9:参数推断 Chp10:假设检验
國軍官兵綠色消費行為之研究---以陸軍某一聯兵旅為例
第十三章 GPS控制网的数据 处理.
聚合型第一種:隱沒帶、島弧 例子:臺灣東方的琉球海溝、南美洲智利海溝. 聚合型第一種:隱沒帶、島弧 例子:臺灣東方的琉球海溝、南美洲智利海溝.
◆ 第7節 氣體動力論 一、氣體動力論 二、氣體動力論與氣體壓力 三、氣體分子的平均動能與溫度 四、單原子理想氣體的總動能與內能
集群分析(Cluster) 根據觀察值在一群變項上的測量值進行分類的多變量分析方法。 在不同專業領域也稱為
財務預測 財務預測的用途 法令相關規定 預測的基本認知 預測的方法 製作預測性報表 財務報表分析 Chapter 16 財務預測.
第四章 多组资料均数的比较 七年制医疗口腔《医学统计学》
Multiple Regression: Estimation and Hypothesis Testing
自慢 社長的成長學習筆記 何飛鵬.
團體工作的倫理議題 CHAPTER 12. 團體工作的倫理議題 CHAPTER 12 團體工作的倫理議題 1.如果我有資格執行個別治療,那麼我也可以執行團體治療。 2.仔細而審慎地篩選團體成員,較符合專業倫理要求。 3.在團體治療開始前,讓成員能先有準備以便從團體中獲得最大利益,是非常重要的。
簡單迴歸分析與相關分析 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2019/8/3.
Chapter1 大師的視界,見證歷史的腳步
Presentation transcript:

Chapter 10 集群分析

概念及應用 集群分析(cluster analysis)是一種用來將屬量的觀測點分群或分類的分析方法 經過集群分析分群之後,在同一群內的觀測點針對某些特性而言,會具有一致性;而分屬不同群的觀測點,針對同樣的特性則會有顯著的不同 基於上述的定義,集群分析得以應用於財務、行銷、政治等許多的領域 利用集群分析可以將具有類似財務狀況的公司歸為一群,以利選取投資標的 在行銷方面,則可以將具有類似消費偏好的消費者區隔出來,以利於產品的定位和行銷

集群分析的基本想法 學生數學及英文成績散佈群 假設某高中有一班共有15位同學,將其依數學及英文兩科學習的表現予以分群,以判斷哪些同學需要進行特殊的輔導

集群分析的步驟 選擇衡量相似性(similarity)的方式 選擇分群的原則(如層級或非層級) 選擇分群的方法(如層級法中之華德法) 決定分群的群數 解釋分群的結果

衡量相似性的方式 衡量相似性的方式 利用距離來衡量相似性 距離(distance) 關聯係數(association coefficients) 相關係數(correlation coefficients) 利用距離來衡量相似性 依據任兩個觀測點或兩個群體間,在p個座標空間(即有p個據以分群的特性或變數)中的距離來決定哪些觀測點或群體是應該歸屬於同一類 兩個點i與j在p維的空間中的歐幾里得距離 標準化資料計算歐幾里得距離 馬式距離(Mahalanobis distance)

分群的原則與分群的方法 先根據分群的變數計算兩兩觀測點間的距離,然後將距離最近的點歸為一群 要做進一步的分群時,我們需要額外計算的是:已經分在一起的那一群觀測點全體與其他尚未分群的每一個觀測點之間的距離 將觀測點歸併時的順序考量 層級(hierarchical) 非層級(nonhierarchical) 兩階段法

層級分群法 層級分群法在分群時可分為凝聚分層(agglomerative)與分離分層(divisive) 凝聚分層法 分離分層法 在分群開始時,先將每一觀測點視為一群(因此如果有個樣本點,即有群),接著再逐步將接近的樣本點合為一群,使群數逐步減少 分離分層法 先確定想要分群的群數,將所有樣本點各自歸入其中的一群,再計算各群的中心值,然後針對每一樣本點,計算其至各群中心點的距離後,將其重新移動至距離最近的一群當中。反覆操作,直到不需重新移動為止

分群群數之決定 集群分析之樹狀圖

凝聚分層法(1) 單一聯結法 兩群體之間的距離定義為,以兩群體各自群體內任一觀測點至另一群體中任一觀測點距離(通常以歐幾里得距離平方代表;如果兩群體各有n1 及n2 個觀測點,則共有n1x n2 個距離)中最近者,作為兩群體間之距離 當群體間的距離確定之後,距離近的群體可以進一步合為同一群,再重新計算群與群之間的距離,並進行下一步的合併

凝聚分層法(2) 完全聯結法 兩群體之間的距離定義為,以兩群體各自群體內任一觀測點至另一群體中任一觀測點距離中最遠者,作為兩群體間之距離 相同地,當群體間的距離確定後,距離近的群體可以進一步合為同一群,再重新計算群與群之間的距離,並進行下一步的合併

凝聚分層法(3) 平均聯結法 兩群體之間的距離定義為,以兩群體各自群體內任一觀測點至另一群體中任一觀測點所有距離的平均值,作為兩群體間之距離

凝聚分層法(4) 中心法 兩群體之間的距離定義為,以兩群體中心點之間的距離,作為兩群體間之距離

凝聚分層法(5) 華德法 求取所有群體的組內平方和(within-cluster sum of squares)最小的情況下,找到最適的分群狀況 在每一次的分群(由多群逐漸凝聚成少群)過程中,都會先計算各種可能分群情況下,各群體的組內平方和及其總和,然後再比較各種可能分群情況之組內平方和總和,並選取組內平方和總和最小的分群情況作為分群的結果

分離分層法 K組平均法(K-means) 先確定想要分群的群數,接著將所有樣本點各自歸入其中的一群,下一步再計算各群的中心值,然後針對每一樣本點,計算其至各群中心點的距離後,將其重新移動至距離最近的一群當中 計算各群的中心值,也針對每一樣本點計算其至各群新的中心點的距離,並將之重新移動至距離最近的一群當中

兩階段法 第一階段先以凝聚分層法(如華德法)分群,並決定選取的群數 第二階段再以此一決定的群數,以非凝聚分層法的K組平均法進行分群 既可某種程度解決非凝聚分層法主觀決定群數的問題,也可以改善層級分群法無法將觀測點變換所屬群體的問題

集群分析的相關檢定 新群體之root-mean-square standard deviation (RMSSTD) R-squared Semipartial R-squared (SPR) 如果此一指標值很大,代表此合併步驟會使群組內差異擴大,故不適合加以合併;而若相似度損失值很小,則表示新的分群較為合適 Pseudo Hotelling’s T2 Test 可用來檢定兩個群體的平均數是否具有顯著的差異,並且判斷兩個群體是否適合加以合併