第八章 連結分析 Link Analysis.

Slides:



Advertisements
Similar presentations
校园及周边治安防范 暨应急预案桌面演练 实 训 乐山应急管理学会 贾 伟. 目 录 校园治安问题包含的内容 校园治安问题的特点 避免引发校园治安问题的对策 校园应急预案桌面演练实训 校园治安问题的成因.
Advertisements

“ 我不能 上学了,我 每天还要帮 家里拾柴火 呢。 ” 给远方的小学生写一封信 书信的基本格式: 开头顶格写称呼,打上冒号; 换行空两格写问候语; 接下来换行空两格写正文部分; 正文结束后,换行写祝颂语; 最后在右下方写上寄信人姓名和 写信日期。
南 通. 南通概述 南通,位于江苏省东部, 东抵黄海,南望长江。 “ 据江 海之会、扼南北之喉 ” ,隔江 与中国经济最发达的上海及 苏南地区相依,被誉为 “ 北上 海 ” 。 南通也是中国首批对 外开放的 14 个沿海城市之一 ,被称为 “ 中国近代第一城 ” 。 南通面临海外和内陆两大经 济辐射扇面,素有.
中醫藥就醫用藥 - 婦女篇 中醫藥安全衛生教育資源中心 中醫藥就醫用藥百分百、就是藥做到: 停、看、聽、選、用專業.
下背痛 林口長庚醫院內科 住院醫師 毛畯台. 下背痛常見原因 軟組織受傷/背部筋膜發炎 椎間盤突出症 脊椎退化性關節炎 壓迫性骨折 椎間盤滑脫 惡性腫瘤 泌尿道疾患 姿勢不良.
華德學校上午校 「協助小學中國語文科教師建立專業學習型社群」計劃 (2008) 總結分享會 二零零九年一月十日.
正修科技大學 周燦德 講座教授 技職再造方案的理念與實務. 技專校院建構職能導向 之產學鏈結實施策略及流程 技專校院建構職能導向 之產學鏈結實施策略及流程.
園藝二乙 1 號 丁楷儒 32 號 孫子恩. 1. 福山萵苣 ( 大陸妹 ) : 福山萵苣,萵苣家族成員之一,鮮甜脆綠又帶有萵苣類的 特殊苦味,用來代替生菜搭配烤肉也別具風味。極少病蟲 害,只需定時澆水施肥就能健康長大,是相當容易種植又 能有大收穫的蔬菜 。 感想: 雖然大陸妹好吃又好種,但種了太多而吃不完.
均衡推进,确保质量 08学年第一学期教学工作会议 广州市培正中学
黑木耳.
投資權證13問 交易所宣導資料(104) 1.以大盤指數為標的之權證,和大盤指數的連動性,為什麼比和期交所期指的連動性差?
如何把作文写具体.
第一节 人口与人种 第一课时.
解读我党发展史 思索安惠美好明天 主讲人:王辰武.
第五单元 口语交际和作文.
第八章 負債 8-1 負債之意義及內容 8-2 流動負債 8-3 長期負債 8-4 其他負債.
工业财务状况表 财务部分培训 (2010年年报).
第5课 长江和黄河.
銓敘部研究規劃自願退休公務人員月退休金起支年齡延後方案座談會
瓦罐湯 “瓦缸煨汤”是流行于南方民间的一种风味菜肴。它采用一种制特的大瓦缸,其缸底可以烧火,缸内置有铁架,厨师将装有汤的小瓦罐一层层地码入缸内的铁架上,然后点燃木炭,借用木炭火产生的高温将瓦罐内的汤煨熟。
1.數學的難題 如下圖所示,你知道表格中的問號應填入什麼數字嗎?
这是一个数字的 乐园 这里埋藏着丰富的 宝藏 请跟我一起走进数学的 殿堂.
第九章 欧氏空间 §1 定义与基本性质 §2 标准正交基 §3 同构 §4 正交变换 §5 子空间 §6 对称矩阵的标准形
第九章 欧氏空间 §1 定义与基本性质 §6 对称矩阵的标准形 §2 标准正交基 §7 向量到子空间的 距离─最小二乘法 §3 同构
合肥学院外国语言系2012年度 学生工作表彰大会.
定海区渔农村集体资产 股份合作制改革工作 档案管理培训班
真题模拟 主讲:凌宇 时间:6月9日.
树立信心,沉着应战,吹响中考冲锋号 ——谈语文学科的复习备考及考试技巧.
北京市工作居住证办理讲解.
请大家欣赏龙岩, 新罗区 上杭,武平, 连城,长汀, 永定,漳平 小吃和特产.
游 泳 理 论 课 位育中学 高蓉.
1.某公司需购一台设备,有两个方案,假定公司要求的必要报酬率为10%,有关数据如下:
第一节 人口与人种 光山一中 屈应霞.
祝贺您获得国家留学基金资助 请您登陆“国家留学网”查看《出国留学人员须知》,您在出国前及在外学习期间所需要办理的手续及具体流程,以及可能遇到的政策上疑问均在此《须知》上有所列明。
第五章 二次型.
实际问题与一元二次方程(一).
抚宁县第五中学 教学暨新课改推进工作会.
《社会体育指导员讲座》课程整体设计介绍 席永 副教授 2015 年 6 月
专项建设检查工作总结 本科试卷 毕业论文(设计) 合格课程 专项检查工作基本情况 专项建设的工作内容 专项建设检查工作情况
审题与立意 夏邑高中高四语文组.
告状 一位叫杨鲁的孩子,告他父亲杨庆的状。他极其认真地向父亲所在的工厂党委书记指控,说父亲不让儿子“游戏人间”,每天“画地为牢”,要儿子“咬文嚼字”,稍不满意,还要“入室操戈”。他声称父亲打他总是“重于泰山”,不象母亲打他“轻如鸿毛”。并且表示“庆父不死,鲁难不已”。
學校社工師服務與家訪技巧 三峽區駐區學校社工師 陳若喬.
第三部分 区域可持续发展 第二单元 区域可持续发展 第7课 资源跨区域调配. 第三部分 区域可持续发展 第二单元 区域可持续发展 第7课 资源跨区域调配.
述职报告 ( 二○○七年度 ) 述职人: xxx 部 门: 计划财务部 岗 位: 部门经理.
转正述职报告 电商文案策划 XXX.
护患沟通技巧 护理部 马红云.
一、會計循環之意義 二、會計憑證概要 三、日記簿概要 四、分類帳概要
思想道德修养与法律基础 主讲人:XXX.
特种设备安全法简介 中原油田分公司 杜习广 2015年4月 视频.
马街乡综治维稳工作情况汇报 汇报人:xxx.
第三課 宗教(倫理)的獨特向度 單元 3.2 全球倫理:兩項原則和四項座右銘
通病文章 休 闲   今天天气真好,晴空万里,天上飘着朵朵白云。(偶可从没见过这样的情景^_^)我和同学小刚一起骑车去上学,突然他的车气门芯坏了,我就把我车上的拔下来给他装上,我俩继续一起高高兴兴地骑车往学校赶。(原来“我”的自行车可以不用气门芯啊^_^)   我们经过一家百货商店时,我不禁感慨道:啊!看来人民生活水平的确提高了,你看那位农民老大爷,左手一台电冰箱,右手一台电视机,一溜小跑回家去了。(比周星弛在《功夫》里还要厉害?!)都说一心不能二用,当我注视老大爷的时候,冷不丁岔道里冲出来一位老太太,说
科學與科技課程 教師分享會 二OO四年五月七日.
初中《思想品德》课程改革 回顾·现状·展望
应如何深化普通高中学生综合素质评价 北京教科院基础教育研究所 赵学勤 2010、12、14-15.
追问课堂,寻求效益 —有效教学的几点思考 牟平区实验小学 战丽娜.
电商2班 第五组. 电商2班 第五组 小组成员: 组长:汤昀 成员:杨阳、陆萍、邹斯斯、吴晓庆、吴盈盈.
陈 汉 文 厦门大学会计系 主任 经济学教授 博士生导师
我真的很不想活,日子過得太沒有意思了。. 我真的很不想活,日子過得太沒有意思了。 聽起來,你現在的日子真難熬,你 願意說說看為什麼嗎?
让道德之花越开越鲜艳 主讲 xxx.
老员工心态管理.
平昌县泥龙初中校本培训 中小学微型课题研究
二、感谢信的种类 根据寄送对象不同,感谢信可以分为三种: 1、直接寄送给感谢对象; 2、寄送对方所在单位有关部门或在其单位公开张贴; 3、寄送给广播电台、电视台、报社、杂志社等媒体公开播发。
热烈祝贺医院开业.
產品責任險的意義 想一想,什麼是「產品責任險」? Q
1.调整707路 顾家庄桥西 大北窑南 撤出路由 调整新增路由 新增有路无车路由 图例 新增首末站 维持现状路由 维持现状首末站 城南嘉园北
1 網路開站停看聽. 1 網路開站停看聽 1.1 商機與契機 環境景氣與無薪假的衝擊 就業與創業的選擇 現今職場工作種類五花八門、無奇不有,相信都不出:「謀職就業當僱員」,或是「獨立創業當老闆」這兩大類。一般來說,選擇前者是較多人的情況,也是感覺上比較保險而且穩當的方式;後者聽起來好像要具備不小的資金門檻,足夠的人脈,以及過人的勇氣與毅力才稍有可能一試。
古诗鉴赏.
戒波罗蜜多.
實習學生:陳姵儒 指導教授:潘明全 實習單位:戴正彥升大學中心
Presentation transcript:

第八章 連結分析 Link Analysis

連結分析 簡介 圖形基本觀念 個案研究 連結分析的優、缺點

簡介 商業世界是一個佈滿著關係的世界,透過關係,我們可以將人們,地方及事物連結在一起。

簡介 關係無所不在,這些關係中包含了大多數資料採礦技術無法直接利用的豐富資訊。連結分析(LA)就是可以利用這些關係技術。

圖形基本觀念 一個圖形包括了兩個部分: 頂點(nodes,有時候稱為頂點vertices),指的圖形中有關係的事物,他們都有名稱,且通常另外還有有用的特質。 稜(edges)指的是由關係連結在一起的一組頂點,稜以其連結的兩個頂點來表達,因此(A,B)或AB即指連結AB兩點的稜。

圖形基本觀念 下圖是個加權圖形(weighed graph)的例子中,其中每個稜都有一個權值。在這個例子中,各個加點代表顧客所購買的產品,稜的權值代表包含兩種產品的購買量。

圖形基本觀念 此一圖形提供了解決購物籃分析(market basket analysis)問題的方法,正如我們在第八章所討論的,這對於將購物籃資料視覺化也是很有用的工具。 下面將描述圖形理論中兩個經典的問題,這兩個例子將可以清楚地說明圖形呈現問題和解決問題的威力。在此,我們藉由範例提供圖形理論中的關鍵概念,可以讓讀者熟悉圖形的運用,並且成為進一步討論連結分析的基礎。

康尼斯堡的七座橋 康尼斯堡在普格河上有兩個彼此相連的島,還透過七座橋與城市的其他地方相連。下圖中畫出可以一次橫跨城市裡的五座橋的一條路徑。

康尼斯堡的七座橋 尤拉提出一個問題:是不是可能從城裡的任一個地方為起點,一次走過城裡的七座橋,而不必弄濕自己? 為了解決此一問題。尤拉發明了圖形的概念。他將康尼斯堡的圖以四個頂點和七個稜的圖形來表示,如下圖,部分頂點之間有一條以上的稜相連,表示這之間有一座以上的橋相接。要找出能一次視察康尼斯堡所有橋樑的路線,就等於找出可以一次走過圖形中所有稜的路徑。

康尼斯堡的七座橋 尤拉利用圖形中由每個頂點起始和結束的稜的數目,找出解答.此種稜的收目稱為頂點的自由度 (degrees) 。尤拉告訴我們,只有在圖形中所有頂點的自由度皆為偶數時,尤拉路徑才可能存在,除非圖形中僅有兩個頂點。

業務員旅行的問題 一位業務員必須拜訪在許多城市的客戶,他計畫飛到其中一個城市,租一輛車,拜訪那裡的客戶後,然而開到其他城市去拜訪其他的客戶,他把車子留在最後一個城市,之後飛回家。何種路線可以讓他旅行距離最短,卻可以一次拜訪所有的城市?

業務員旅行的問題 四個頂點的圖形中最複雜的要算是四個頂點間兩兩彼此相連結的圖形。在此圖形,有24條不同路徑可以一次走完四個頂點。為了計算路徑的數目,我們可以從任一頂點開始(四種可能性),然後走到任何其他的三個頂點,之後走到任何其他二個頂點,然後是最後一個頂點(4x3x2x1=24!)。包含n個頂點的完全連結圖形有n階乘個路徑來走完所有頂點。

業務員旅行的問題 如果把圖形理論擱在一旁,電腦有非常好的啓發式演算法可以提供業務員旅行問題合理的解答。電腦可以找出相當短的路徑,然而無法保証是其中最短的一條。如果你有一個類似的問題,這是相當有用的事實。常見的演算法是貪婪演算法(greedy algorithm): 路徑是從圖形最短的稜開始,接著從最短稜的兩頂點中找其中一個新的頂點繼續走下去。這樣找出來的路徑通常相當短,但不必然最短的。

業務員旅行的問題

個案研究(1) 誰從家裡用傳真機? 連結分析能用來分析本地電話公司的紀錄,以確認哪些家庭用戶家裡比較可能有傳真機? 為什麼要找出傳真機? 為什麼要找出傳真機?  在本個案中,業者已經針對在家工作的SOHO族發展了一套服務,針對此類顧客的行銷目的,對該公司而言是一個革命性的概念。

個案研究(1) 原先他們對這些顧客收取較高的公司電話費率,而非一般住宅的電話費率。他們非但沒有針對這些顧客給予特別的行銷計畫,反而讓他們無法享有一般住宅的低廉費率-因為視他們如同一家小公司而懲法他們。 對這家公司而言,發展和銷售SOHO族的套裝計畫來改善對SOHO族顧客的服務代表對客服務的新出擊。但誰才是我們的目標顧客呢?

個案研究(1) 發送和接收傳真的顧客至少會有兩個號碼 - 如果他們只有一號碼,業者將有機會賣給他們第二個號碼。為了提供較好的顧客服務,只使用一個號碼的傳真顧客必須知道如何讓插撥進來的電以等待的狀態保留,否則可能會干擾傳真的進行。也有其他的可能性:擁有傳真機的顧客也許喜歡以傳真而非郵件的方式收到帳單,可以省下郵資和印刷成本。簡言之,能確認誰從家裡收送傳真是相當有價值的資訊,此一資訊可以提供增加收益,減少成本,以及提高顧客的滿意度。

個案研究(1) 資料就是圖形 此一分析所做的原始資料是通話明細資料帳單系統每月帳單,每筆資料包含80個位組的資料,資料就像: 資料就是圖形  此一分析所做的原始資料是通話明細資料帳單系統每月帳單,每筆資料包含80個位組的資料,資料就像: ●撥號者10位數的電話號碼:包括三位數的區域 碼,三位數的交換碼,四位數是該線路的號碼; ●收話者10位數的電話號碼; ●付費者的10位數的電話號碼; ●通話日期和時間; ●通話時間長度; ●其他,如星期幾以及該通電話是否在一個付費電 話上進行。

個案研究(1) 此一分析將資料減少三個變數:通話時間長度;撥號者的電話號碼和收話者的電話號碼。電話號碼是圖形中的頂點,電話本身則是稜,以通話時間長度為其權值。首先,注意圖形共不是相連結的,它包括了兩個完全分開的部分。第二個差異更為重要,這裡的稜是有箭號的,表示他們以有方向性。每一個稜始於撥號者,結束於收話者。

個案研究(1)

個案研究(1) 方法: 找傳真機是基於一個簡單觀察:傳真機只能與傳真機通話。一己知有傳真機的號碼能擴充至其撥出或收到的號碼。實際上一個住宅型顧客可能有幾類的傳真機使用情況: ●傳真機專用的線路: ●兼用的線路: ●資料的線路:

個案研究(1) 假設傳真機只能撥給其他傳真機,對使用專屬線路的傳真機而言是正確的,雖然此─規則也有例外:例如撥錯號碼時。為了區別兼用路,專屬線路以及資料線路,我們假設任何曾經撥過查號台─104的電話必然是語音線路兼用的傳真線路或者只是一般的語音電話;當兼用線路撥給另一個號碼時,我們無法得知該通電話是語音或資料傳輸。另一方面,這些兼用線路的確代表我們賣給顧客一個新號碼機會。

個案研究(1) 用來找出傳真機的過程包含以下的步驟: 從已知的一組傳真機開始。(從工商名錄 收集而來) 2. 找出打給或接到上述這組號碼,且這些電話的通話時間必須在10秒以上。這些電話號碼都具有候選資格。 ●如果這些候選的號碼曾經與104的通話記錄, 或者某一號碼確認為兼用的號碼,則這個號碼將 歸屬於語音/傳真兼用號碼那一組。 ●否則,這個號碼則歸類為已知傳真號碼那組。 3. 重複步驟一與步驟二直到找出確認所有號碼的情況。

個案研究(1) 部分結果: 我們使用的電話記錄樣本包括了3,011,819通話,這些電話是一個月內從19,764個家庭中撥出的。找出傳真機是一種圖形著色的演算法(graph coloring algorithm)。這種類型的演算法必須檢視整個圖形而且把不同頂點標示不同的顏色。在這個個案中,顏色分別為「傳真」、「兼用」、「語音」、「未知」,而為紅色,綠色,黃色,和藍色。一開始所有頂點都是「未知」的頂點,得到其他意義性的標示。

個案研究(1) 下圖顯示一個有15個號碼和19個電話的通話圖形。首先,已知是傳真機的號碼標示為「F」兼用的號碼標示為「I」。 ●任何連結到一個「傳真」頂點的「語音」頂 點,標示為「兼用」。 ●任何連結到「傳真」頂點的「未知」頂點, 標示為「傳真」。  這個流程持續進行,一直到所有連結到「傳真」頂點的所有頂點都有「傳真」或「兼用」的標示。

個案研究(1)

個案研究(1)

個案研究(2) 區隔行動電話顧客: 本個案研究將連結分析應用於行動電話業務上,為了在現在顧客中進行區隔,以銷售析的服務。 區隔行動電話顧客:  本個案研究將連結分析應用於行動電話業務上,為了在現在顧客中進行區隔,以銷售析的服務。   資料:行動電話資料與在上一個傳真機個案研究中的電話明細資料相似。每個電話都包含下幾項變數: ●撥話端和接話端的電話號碼。 ●電話撥出的位置。 ●撥出電話的顧客帳號。 ●該通電話的通話時間。 ●時間和日期。 ●其他,與本研究無關者。

個案研究(2) 未利用圖形理論的分析: 在未利用連結分析之,行銷部使用單一指標來進行市場區隔,這個指標是通話長度(MOU),也就是每一顧客每個月使用行動電話時間長度。這項關聯性並不精確,因為它並未考慮折價時段以及免費夜間和週末。儘管如何,MOU還是一個好指標。除了MOU以外,他們對顧客行為的了解僅止於其帳單總額,以及顧客是否準時付款。他們仍然留了許多資料未能使用。

個案研究(2) 兩個顧客的比較(利用LA): 下圖舉例說明兩個顧客在一個典型的月份中的通話型態。這兩位顧客有相似MOU,然而其通話型態卻極端不同。約翰的通話模式是一個相當小且緊密的圖形,而珍的通話模式卻因為許多不同的通話對象而開展成很大的圖形。

個案研究(2)

個案研究(2) 如果珍滿意她的行動電話服務,她的使用很可 能會成長,甚至影響許多她的朋友和同事轉換 行動電話服務廠商。舉例來說,提供珍每通電 話第三分鐘免費服務,可能誘使她延長其許多 通話時間較短的電話。 另一方面,如果提供約翰同樣的服務,若可能 減少的帳款金額。

個案研究(2) 現在,如果競爭對手試圖接觸珍和約翰,那麼 會發生什麼狀況?誰更可能接競爭對手的條件? 猜測珍有較高的價格敏感度,因此可能對其他 條件較為敏感。然而,再想一想會發現,改變 行動電話服務廠商對珍來說可能很不方變,因 為她必須要改變電話號碼。仔細觀察打電話給 她的人數,我們可以看到珍相當依賴她的行動 電話號碼。她甚至使用語音信箱的服務。她必 須通知的人數是一道阻止她改變行動話業者的 慣性。

個案研究(2) 約翰沒有此種慣性,而且對其行動電話業者可 能沒有忠誠度─只要該業者能提供他星期三上 45分鐘電話會議不中斷的服務品質即可。 珍也有很大的影響力,因為她與這麼多不同的 人通話,他們都知道珍滿意或不滿意她的行動 電話服務。她是一個行動電話業者想要讓她滿 意的顧客。但是,她不是用傳統市場區隔方法 會設定的顧客。

個案研究(2) 連結分析的威力:連結分析在分析行動電話資料時扮演了兩種角色: 視覺化的威力。可以看出有些圖形代表通話型態,使通話型態的部分特性,如慣性及影響力更為明顯。以這個例子來說,我們選擇兩個從先前市場區隔技巧看來十分相似的顧客。連結分析顯示出他們特定的通話型態,以及他們之間的差異。 應用連結分析在視覺化產生的概念來擴大顧客群。 例如:進行電話會議的能力是我們想要的,但是誰會是最佳的潛在顧客?一個可能找出彼此互相通的顧客群。

連結分析的優、缺點 連結分析的優點: ●它適用於連結類型的資料 ●它在視覺化方面很有用處。 ●它創造出衍生的特性。 連結分析的缺點:   連結分析的缺點: ●它並不適用於很多類型的資料 ●很少工具支援連結分析。 ●在關聯式資料庫上的操作效率不佳。