第一次上統計實習課 就上手
上課規則 助教:葉哲瑋 Email:d99741008@ntu.edu.tw 負責事項 禮拜五習題講演(不ㄧ定上到兩點) 每次針對當週老師上課做重點複習與習題練習 另外補充相關重點 出作業 考試前做複習與重點整理
上課規則 上課可以吃午餐,喝東西,如需早退也可自行離開 所有投影片會上傳到老師教學網頁上面去 統計學作業繳交時 Google 郭瑞祥,出現的第一個網頁即是老師教學網頁 統計學作業繳交時 請記得附上你的學號、系級、姓名 方便TA登記你的作業成績 (請於第二堂上課前繳交完畢,逾期不收!!)
統計學內容 敘述統計學 機率分配 推論統計學 研究如何簡化與表示現成之統計資料 圖表方式 數值方式 研究如何利用母體中所抽取之樣本,去估計、檢定或預測母體中之未知特性之科學方法 抽樣 母體(Population) Parameter 樣本(Sample) Statistic 推論
陳林滿天下
星座統計 健保局統計室提供的2006年台灣地區死亡總人數共十三萬五千多人資料,以西洋十二星座日期進行分析,發現一些有趣的統計。 統計發現,平均死亡年齡最年長的前三個星座分別是魔羯座、水瓶座、天秤座(七十四點四六歲);若以性別細分,男性最長壽的星座是魔羯座的七十三點四四歲,女性則以天秤座的七十六點六八歲最長壽;牡羊座則不分男女,平均死亡年齡雙雙殿後。
星座統計 那一個星座2006年非自然死亡(意外、自殺、他殺)人數最多?前三名依序是雙子座、牡羊座、射手座,各約佔非自然死亡人數百分之十比例;水瓶座、魔羯座、雙魚座的非自然死亡比例較低,約百分之九或以下。 死亡年齡小於三十歲的族群中,以巨蟹座百分之五點零六最多,其次為獅子座、雙子座。
統計應用 先試想一個問題:如果你到超市買啤酒,你會順便買甚麼?美國最大零售業者威名百貨(Wal-Mart)曾經做過一個調查,他們想要了解啤酒與哪一種商品一起售出的機率最高,也就是買啤酒的人會順便購買甚麼?希望透過這樣的分析促進店內動線設計,便利客戶以提升客戶關係,並同時提升金額 你的直覺是甚麼? 答案是紙尿布
資料種類 資料的型態有三種 屬質(Qualitative) 和屬量 (Quantitative) 資料 名目資料(Nominal data) 資料的值是不同的類別 順序資料(Ordinal data) 看起來像名目資料,但是它們的數值是有順序的 區間資料(Interval data) 是真實的數字,諸如身高、體重、所得和距離之類 屬質(Qualitative) 和屬量 (Quantitative) 資料 橫斷面資料(Cross-Sectional)/時間序列資料(Time-Series Data)
各種資料 & 資訊… 資料 區間資料 順序資料 名目資料 Categorical? N Y Ordered? Y Categorical Data N 名目資料
Excel—長條圖與圓型圖 長條圖和圓型圖(Bar chart and pie chart) 先選取你要跑出資料(整理過資料) 插入選取直條圖(Bar) or 圓形圖(Pie) ,圖型便會自動跑出 如要修改圖表標題,先點選圖表點選Excel 上方圖表工具之版面配置可以點選圖表標題、坐標軸標題、資料標籤等進行修改 若只有原始資料,可以使用Excel 函數的countif計算出各種分類下的次數 在任何一格鍵入=countif([Input range], [Criteria]) Input range 為所要輸入的範圍,例 B1:B286 Criteria 為計算的準則,例鍵入1即可算出資料為1的次數
Excel—直方圖 直方圖(Histogram) 要先決定好分幾組,並輸入每組的上界於Excel Sturges’s rule: 1+3.3*log(n) 依照課本表2.6選取或方便性選取 點選Excel 上方資料資料分析直方圖將輸入範圍與組界範圍選取好 標記表示資料是否有選取到標題,如有選到必須打勾 記得勾選圖表輸出 直方圖出現後進行下列步驟修改 將組界為其它且頻率為0那一列內容刪除 點選圖表上直條圖並按滑鼠右鍵選取資料數列格式將列別間距改為無間距 每組是大於下界,小於等於上界(第一組除外)
Excel 累積機率圖 累積機率圖(Ogive) 圖型出現後進行下列步驟修改 將組界為其它且頻率為0那一列內容刪除 將出現之直方圖刪除(點選任一矩形,並按滑鼠右鍵刪除) 改變刻度大小(如果直軸最大值不為1):點選直軸並按滑鼠右鍵點選坐標軸格式將坐標軸選項中的最大值改為1 點選橫軸並按滑鼠右鍵點選坐標軸格式將座標軸位置中刻度與刻度之間相距(W)改成刻度上(K)
Excel 莖葉圖 莖葉圖(Stem-and-Leaf display) 折線圖(Line chart) 增益集Data Analysis Plus Stem-and-leaf- Display Input range要輸入資料範圍 Increment表示 difference between stems 資料如有選取標題則要勾選Labels 折線圖(Line chart) 時間序列資料 選取資料插入折線圖 散佈圖(Scatter diagram) 探討兩變數之間的關係 選取資料插入散佈圖
Excel 樞紐分析表 為例樞紐分析表(以 Example 2.10 ) 插入樞紐分析表選取好你要的資料範圍按確定 右邊會出現樞紐分析表欄位清單可用拖曳方式將想要的資料拉到列與欄, 可得到cross-classification table 在此處更改直欄位設定,改 成項目個數
Excel 雙變數長條圖 使用Excel 畫出雙變數長條圖 選取cross-classification table全部資料插入選取直條圖(Bar) 如跑出圖形之橫軸與直軸資料剛好相反點選圖型按滑鼠右鍵點選選取資料點選切換列欄