Statistics Chapter 1 Introduction Instructor: Yanzhi Wang
What is statistics? Statistics is the science of data, where data are collected, organized and interpreted with analytical techniques. In general, the goal of statistics is to learn from data. What have you learned in the high school? Probability Description statistics Correlation, regression, Beta coefficient Some examples: Constellations Population changes Survey for president election How will be NTU student?
Constellations 最會記恨的星座 會賺錢的星座 星座男誰最會吃醋? 第一名:魔羯座。 第二名:金牛座。 第三名:處女座。 第三名:處女座。 會賺錢的星座 第一名 處女座 第二名 天蠍座 第三名 白羊座 星座男誰最會吃醋? 第一名 雙魚座 第二名 金牛座 第三名 巨蟹座
Birth rate, death rate and population changes
Survey for president election 2016年中華民國總統選舉候選人支持度(洪秀柱廢止提名後) 全國 民調來源 完成日期 樣本數 誤差 蔡英文 朱立倫 宋楚瑜 未表態 陳建仁 王如玄 徐欣瑩 TVBS 2016年1月2日 44% 24% 15% 18% 世新大學 42.10% 21.40% 13.50% 23.00% 壹電視 2016年1月3日 38.70% 16.40% 13.70% 31.20% 趨勢 42.80% 17.90% 11.50% 27.80% 決策 45.20% 16.30% 16.10% 22.90% 典通 2016年1月4日 38.40% 16.80% 13.60% 自由時報 47.98% 14.80% 10.29% 26.93% 43% 25% 17% 2016年1月14日 16% 號次 政黨 候選人 得票 得票率 當選 總統 副總統 1 中國國民黨 朱立倫 王如玄 3,813,365 31.04% / 無 無黨籍 2 民主進步黨 蔡英文 陳建仁 6,894,744 56.12% 3 親民黨 宋楚瑜 徐欣瑩 1,576,861 12.84% 民國黨
How will be NTU student? 誰是台大學生? — 性別、省籍與城鄉差異 by 駱明慶 經濟論文叢刊 第 30 輯 第 1 期 ( Mar 2002 ) 省籍分布方面, 1954 - 1991年間, 約36%的台大學生為外省籍。台大學生為外省籍的比例雖逐漸下降, 但省籍間的差異仍然顯著存在。外省人在成為台大學生的優勢上, 又比成為大學生的優勢為大。 在城鄉差異方面, 1997 - 2000年間, 相較於全國平均的0.89%, 3.06%的台北市人口和6.10%的大安區人口會成為台大學生, 台東縣的比例則只有0.19%。各縣市成為台大學生機率的差異程度, 也明顯大於各縣市成為大學生機率的差異程度。 82%的台大學生來自前20所明星高中, 受大學教育機會的篩選過程, 在高中階段就已開始。 迴歸分析顯示, 各縣市的家庭背景和教育支出等變數, 僅能解釋不到五分之一的縣市差異。 而台大法學院學生的背景資料顯示, 42%的父親和27%的母親為大學畢業生, 父親或母親為公教人員的比例高達42%, 均遠高於大學生和一般人口的比例。
How will be NTU student? Version 2.0 接續駱明慶 (2002) 對1954-2000年台大學生組成的分析, 研究使用2001-2014年台大學生的學籍資料, 分析多元入學對於學生來源分布的影響。 結果發現,透過對個別高中推薦學生名額的限制, 「繁星計畫」 和 「繁星推薦」 使得台大學生在高中畢業學校與學生居住縣市的集中度, 以及學生居住地平均所得均下降, 學生高中畢業學校的總數則明顯增加。 性別比:個人申請的學生組成有助平衡各系性別比:男生多的系在個人申請會多招到一些女生,女生多的系會多招到一些男生,整體而言台大學生的女性比例降低; 高中集中度:繁星推薦有效分散台大生畢業的高中:台大生畢業高中的總數從2001-2003 的 183 所、2007-2010 的 206 所,增加至 2011-2014 的 298 所,在繁星推薦下成長了 44.7%; 地區分佈:繁星計劃和繁星推薦顯著改變了台大學生的區域分佈,降低台北縣市和其他都市學生成為台大生的機率,也提高其他地區的機會; 居住地區所得水準:繁星 < 考試入學 < 個人申請
Some Statistics problems What does it look like if we randomly plot black and white on a paper? Do you believe the instruction from god? http://www.9420.com.tw/museum/te/nougat/motiongame.html What do you care about more on the accuracy? A pharmacist claims that the rate of detecting pregnancy is 99%. A analyst claims that an economic model could predict 90% of bankruptcy status (survive or die) of listed firms. How could we describe a relation? Aggregate income and consumption. Is a relation absolutely linear? Education and income are related?
Applied Statistics- Few Cases 康乃爾大學「小便定律」:哺乳動物的尿尿時間都是21秒 在人類的世界中,大家總覺得女性比男性小便時間久,但是就真正排尿的過程而言,其實男女是一樣的。事實上在地球上不分體型大小,所有哺乳類動物的小便時間都是一樣的,都是21秒。 根據康乃爾大學(Cornell University)研究出的一個「小便定律」(the Law of Urination),他們在亞特蘭大動物園測試不同動物,發現動物的體型不太對排尿時間有影響,所有哺乳類動物的排尿時間都是21秒(包含13秒的標準誤差),當然根據體型的不同,尿液的量從100毫升到100公升不等。在這篇研究報告裡提到,中型動物像是狗或羊,牠們的尿道較短,因此地心引力的重力加速度較小、排尿較慢;但相對地牠們的膀胱較小、尿量少,因此對比體型龐大的動物---尿道長、引力加速大,但尿量大,算下來兩者整體排尿時間差不多。但這種算法還是有例外,地心引力對於極小的哺乳動物排尿幾乎沒有影響,像是蝙蝠或是老鼠,牠們尿尿只需要約1秒,比起引力,尿液的黏性與表面張力才是影響排尿的主因;牠們的尿是用滴的,不像大型哺乳類的噴射狀。
Income inquality 前總統馬英九表示,根據主計總處最新102年家庭收支調查,台灣去年的貧富差距,如以每戶可支配所得計算五等分計算是6.08倍,是連續第四年下降,最近五年來最低;如果以更準確的每人可支配所得五等分計算,是4.08倍,更是從民國89年以來最低。馬英九說明,如果以全社會比較的吉尼係數來看,這是最為準確的評量貧富差距指數,也是世界銀行、國際貨幣基金通用的評量指數。以每戶為單位計算,去年是0.336,是第四年維持下降趨勢,民國90年以來最低;以每人為單位計算是0.288,也是第四年維持下降,更是民國77年以來最低。 朱敬一院士的說法: 要細看一國所得分配時間數列的變化,一個辦法就是將所得做更細的切分,例如切為十等分、廿等分、甚至一百等分。在概念上,這是有道理的。五等分切割所得最高20%的切分點在近年是家庭年收入180萬台幣以上,這表示夫妻每月各賺8萬的受薪家庭,會與郭台銘、魏應充等超級大富歸入同一級而不做區分。如此,若是薪水凍漲但郭魏等富豪大賺錢,則五等分層級所得比與吉尼係數都不會有太大的改變。這樣的數據當然是不合理的。
Income inquality
Applied Statistics- Few Cases One day, CEO asks to work on a proposal about whether or not the company should devote to the corporate social responsibility (CSR). 企業是否應當致力社會企業責任? If you were the staff, how would you conduct this requested report? Step 1? Step 2? Step 3?
Content of Statistics I Introduction Description statistics Probability Random variables Distributions Estimations Hypothesis testing