Referendum MythBusters 公投流言終結者 Referendum MythBusters
引言 一打開電視新聞或是電腦,便可看到許多關於公投提案的消息,這是台灣人民在大選前的日常,許多似是而非的謠言以及各種網路流言也隨之出現,究竟這些報導還有謠言的真實性有多高?我們所接收到的訊息到以及認知的真的是事實嗎? 公投流言終結者的團隊將會藉由大數據科學,嘗試以客觀的分析來探討流言的真實性、以及公投結果的真正成因,希望給予社會大眾一個可以經過科學檢驗、接近真實的答案。 為何需要科學驗證? →我們日常生活的認知及接受到的報導可能是個案而不是全貌,因此當個案被廣為宣傳時,會造成我們認知上的誤認
引言 關於公投…… 本次公投斥資近50億,許多學者視公投結果為一項「大型社會調查」,能視此結果可有效反映議題態度的區位分佈。 隨投票結果開箱,關於公投的論述接連四起,公投流言終結者希望檢視以下四個廣泛流傳的「公投流言」,並對影響公投可能的因素做一個探索性的討論,透過相關係數以及區域面量圖進行驗證: 流言一:教會的運作是否影響了同婚公投(10、11、12、14、15)案結果流言二:所得的高低是否影響人的保守或進步傾向,進而影響了同婚公投(10、11、12、14、15)案結果 流言三:東奧正名公投為較具有意識形態的公投,國民黨的支持者是否會傾向反對意識形態與其不同的東奧正名公投? 流言四: 教育程度與世代對東奧正名公投的影響? 年輕人與大學生是否比較支持東奧正名公投?
選定所得中位數、大學生畢業率、年齡中位數、教會個數、國民黨得票率等變相分別對特定公投案進行分析。 引言 終結者規則: 選定所得中位數、大學生畢業率、年齡中位數、教會個數、國民黨得票率等變相分別對特定公投案進行分析。 資料來源: http://data.cec.gov.tw/全國性公民投票計票結果/ 106年度_法人教會概覽 https://rfrd-tw.github.io/?fbclid=IwAR2VLZLcbW80zDqecJ7YDU4ABMbA9ksT1AyqrCqaZNMejdVl1S9F1O0QxXY https://drive.google.com/drive/folders/1JF1ofooYij2c7Ap2rC6uRDOR-zo1lAZd?fbclid=IwAR2kIBzcrIsB3cEJRhy7iiuLC7Rkl9pFrHol8haw4sZwSs0Z22D-NTOF-Qg https://drive.google.com/drive/folders/1UkbTurPkT_MBSXwoKflqoH0T1XqvJT48?fbclid=IwAR2kIBzcrIsB3cEJRhy7iiuLC7Rkl9pFrHol8haw4sZwSs0Z22D-NTOF-Qg
PART ONE 流言一: 教會在同婚五公投中有影響力,一地的教會愈多代表動員投出反同票的能力愈強
將教會數量與同婚五公投同意率以四分位距為基準分成四等級後,以一地的教會數量代表教會的動員能力高低,與同婚五公投合併,右表為其相關係數表格。 PART ONE 流言一 將教會數量與同婚五公投同意率以四分位距為基準分成四等級後,以一地的教會數量代表教會的動員能力高低,與同婚五公投合併,右表為其相關係數表格。 公投案 相關係數 第10案 -0.4669969 第11案 -0.3642947 第12案 -0.004703372 第14案 0.3333873 第15案 0.3192311
PART ONE 流言一
PART ONE 流言一
PART ONE 流言一
PART ONE 流言一
PART ONE 流言一
PART ONE 流言一結論 支持立專法與否與該地教會的多寡無太大的關係。 該地的教會愈多,愈傾向支持平權公投、反對愛家公投。 流言一不成立,且結果與流言一幾乎完全相反。
PART TWO 流言二: 愈有錢的人愈不支持同婚,因為有錢人比較保守
鄉鎮市區綜合所得稅所得總額中位數x公投同意率 PART ONE 流言二 鄉鎮市區綜合所得稅所得總額中位數x公投同意率 公投案 顯著程度 相關係數 第10案 顯著 -0.5276289 第11案 -0.3045678 第12案 不顯著 -0.03902158 第14案 0.3798729 第15案 0.2811856 *同意率=同意票/有效票數
PART TWO 流言二
PART TWO 流言二
PART TWO 流言二
PART TWO 流言二
PART TWO 流言二
PART TWO 流言二結論 我們選擇綜合所得稅所得總額作為指標。 收入越高的族群,越傾向反對愛家公投,並且傾向同意平權公投。 需要注意的事情是,所得並不是絕對的影響因素,仍須考量其他因素對各地區投票意向之影響。 12案也就是所謂專法案跟其他婚姻平權相關公投不同,與所得幾乎沒有關聯,也是值得關注的現象。
PART THREE 流言三: 東奧公投的支持度會受到政黨傾向的影響
PART THREE 流言三 明顯能發現兩邊圖片在大部分區域呈「對稱性」分佈,且在全台灣分部呈現負相關,相關係數為-0.47(高度負相關)。
PART THREE 流言三結論 從相關係數矩陣中,可發現影響「十三案同意率」的原因除了國民黨同意率的負相關外,「所得中位數」與「年齡中位數」的相關性亦然強烈,分別成強負相關和強正相關,因此除了政黨傾向外,「所得」與「年齡」亦為兩個重要指標。
PART FOUR 流言四: 教育程度比較高的地區比較支持東奧公投
PART FOUR 流言四 就全台灣總體趨勢而言,擁有大學學歷者比率與 13案同意率之間的相關係數為-0.028,不僅幾乎無相關,其係數甚至為負。因此總體而言,是否讀過大學幾乎不影響人民對此案之態度。
PART FOUR 流言四 近一步將測量層次縮小至臺北市及新北市兩地區時,卻發現雙北地區大學學歷比率與之間的相關係數為-0.599,為強烈負相關,故可判斷必定有其他因素影響人民的投票行為。
PART FOUR 流言四結論 因此除了是否擁有大學學歷外,我們進一步檢驗大學生的年齡,想了解不同cohort的大學生是否會有不同的價值觀。 年齡層 相關係數(全國) 相關係數(雙北) 20-24歲 0.2058269 -0.4014486 25-29歲 0.1979728 -0.4853443 30-34歲 0.09980743 -0.4995353 35-39歲 0.00605489 -0.5626298 40-44歲 -0.0418012 -0.5888373 45-49歲 -0.09966787 -0.5998861 50-54歲 -0.1337898 -0.6117082 55-59歲 -0.1686113 -0.6187723 60-64歲 -0.1976459 -0.6242314 65歲以上 -0.1813314 -0.6621340 因此除了是否擁有大學學歷外,我們進一步檢驗大學生的年齡,想了解不同cohort的大學生是否會有不同的價值觀。 左表格為各年齡層大學生比率與公投同意率相關係數之表格。 可以得知,全台灣第13案公投與Cohort的影響也多有相關,呈現隨年齡逐漸上升。
總結 科學數據證明在使用特定因素分析時,流言一、二、四有足夠顯著力被打破!能印證許多假設的不成立、或存有疑慮,而破解留言的同時,也發現新的科學事實: ➸教會數量越多的地區,不見得是同婚率支持率低的地區 ➸經濟收入越高的地區,越同意挺同公投之論述 ➸大學學歷者比例越高之地區,越傾向不同意十三公投結果 ➸呈上,也證實十三案同意率除教育因素,也深受世代差異而有劇烈變異 唯一沒打破的流言三,分析中卻也發現國民黨得票率並非唯一影響因素,所得、年齡、教育的影響力依然強烈,或許政黨傾向亦會受人口結構及屬性而有變化!
展望:人工智能、機器學習作為預測公投結果的途徑 機器學習(Machine learning)核心意涵為「用已知的資訊預測未知的資訊」,將我們所擁有的資料,經過統計學、數學上分類分群的演算法,將資料進行分類,進而在未來使用部分特徵即可預測人類行為(如購買商品類別、投票行為等) 我們嘗試以機器學習之方法用我們已知之人口特徵、屬性對投票結果進行預測,將資料以7:3分為訓練集與測試集,透過訓練集建模,預測測試集之公投結果,並將預測結果與真實公投結果比對。
展望:人工智能、機器學習作為預測公投結果的途徑
展望:人工智能、機器學習作為預測公投結果的途徑 從表格可看出使用上述在這篇文章探討之所有屬性預測個案公投,對於第十、十一、十二、十四、十五案來說,教會個數、所得預測影響性隨公投性質變化,而最為顯著能被預測為第十案:「你是否同意民法婚姻規定應限定在一男一女的結合?(同意態度偏向反對同婚)」,預測準確率為55% 而在第十三案的預測當中,當只留「國民黨得票率」進行預測時,可發現預測準確率可以達到56%,意味著「只要能知道該地區的國民黨市長候選人得票率,我們就可以有56%的準確率猜測該地區在公投十三支同意程度」。 整體而言,可以看出當嘗試使用機器學習預測此次公投結果時,雖仍有進步空間,但卻依然有一定程度的解釋力,代表著在未來數據科學更廣泛運用後,是必能為人類或整體社會解開更多謎題,我們所做的是不斷嘗試探索新的可能性,試圖打開所有隱藏在社會下的「黑盒子」。
結語 「流言終結時,我們更加接近真實」 — 公投流言終結者,感謝您的閱讀。