迴歸分析與軟體應用 林 國 欽 博士 商學與管理研究所 台南科技大學.

Slides:



Advertisements
Similar presentations
1051 检验 Chi-Square Test 第七章 Content test of fourfold data test of paired fourfold data Fisher probabilities in fourfold data test of R×C table Multiple.
Advertisements

1 4.5 高斯求积公式 一般理论 求积公式 含有 个待定参数 当 为等距节点时得到的插值求积公式其代数精度至少 为 次. 如果适当选取 有可能使求积公式 具有 次代数精度,这类求积公式称为高斯 (Gauss) 求积公式.
第十三章 医学统计学方法的基本概念和基本步骤
类别资料分析 Categorical Data Analysis 王德育 (T. Y
国家发展改革委宏观经济研究院 吴晓华 副院长、研究员
苏炳华 教授 上海第二医科大学 生物统计学教研室
國有公用財產產籍管理法規及實務 財政部國有財產局 劉芸真.
古今生活大對照 迦密愛禮信小學 六信  尹嘉豪.
1 Chapter 統計學緒論.
管理研究方法 山西财经大学研究生学院 孙国强.
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
双变量关联性分析.
第1章 统计学的基本概念 什么是统计学 基本概念.
概率论与数理统计 课件制作:应用数学系 概率统计课程组.
第一章 緒論.
生物醫學統計學.
大陸高等教育現況之分析 楊景堯 淡江大學中國大陸研究所.
商用統計學 Chapter 12 類別資料分析.
如何定义和确定参考区间 郭健 卫生部北京医院.
老師 製作 統計學.
第二章 研究设计与评价.
第 1 章 資料與統計.
教育統計學(初統) 授課教師:葉玉賢 博士.
苏轼与茶文化 苏东坡的独特茶文化: 饮非其人茶有语.
11. Pearson’s Correlation & Simple Linear Regression
§9.3 线性回归分析 一. 什么是回归分析 相关分析研究变量之间相关的方向和相关的程度,但是相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。 回归分析则是研究变量之间的数量变化规律的一种方法。
多元迴歸 Multiple Regression
第一章 统计学及其基本概念 南京财经大学统计学系.
第一章、統計的基本概念 國立高雄餐旅大學 沈瑞棋副教授.
STATISTICA統計軟體的應用 第二講:廻歸與ANOVA
管理统计学 主讲人: 北京理工大学 管理与经济学院 李金林 电话: 办公室: 中心教学楼1012房间
大眾媒體研究導論 Chapter 4 抽樣 第一部分 研究程序
第七章 SPSS的非参数检验.
十一、簡單相關與簡單直線回歸分析(Simple Correlations and Simple Linear Regression )
統計方法的概念與應用 一、認識統計(statistics)、測驗(test)、 測量(measurement)與評價(evaluation)
4 統計分析程序的選擇.
線性相關與直線迴歸 基本概念 線性相關:兩個連續變項的共變關係,且有線性關係。所謂 的線性關係乃指兩個變項的關係可以被一條最具
第十七章 相關係數 17.1 前言 17.2 相關係數 17.3 功能視窗(Bivariate) 17.4 範例(Bivariate)
第 7 章 抽樣與抽樣分配 Part A ( ).
The Nature and Scope of Econometrics
Workshop on Statistical Analysis
第一次上統計Tutorial 就上手 不是只有上一次嗎.
第四章 抽樣與抽樣分配 4.1 抽樣與抽樣方法 抽樣分配概論 常見的抽樣分配 中央極限定理55
Linear Regression 一元线性回归分析.
第八章 線性迴歸 8.1 線性迴歸概論 8.2 相關分析 8.3 簡單迴歸分析 8.4 迴歸模型係數的推導
生物統計 1 課程簡介 (Introduction)
实验数据处理方法 王永刚.
Introduction to Basic Statistics
抽樣分配 Sampling Distributions
低碳 減碳 組員 侯稀云 劉曉彤 王兆昇.
Introduction to Basic Statistics
Review 統 計 方 法 的 順 序 確定目的 蒐集資料 整理資料 分析資料 推論資料 (變量,對象) (方法:普查,抽樣)
Dr. C. Hsieh College of Informatics Kao yuan University
Chapter 1 統計學緒論. Chapter 1 統計學緒論 Study Report 講述一個神奇而美麗的統計 很多人或許常常在問:「What is Statistics」-統計是甚麼? 統計是製造可信賴的之資料,分析資料的真正意義。 有一列火車上有一位統計學家,一位物理學家和一位數學.
社会研究方法 第7讲:社会统计2.
CH13 超越描述統計:推論統計.
第二章 经典线性回归模型: 双变量线性回归模型
統計學簡介 許明宗.
研究所生物統計課程整合說明 課程規劃及修課建議 楊奕馨 高雄醫學大學 藥學系 研究所生統課程授課教師
Review of Statistics.
医学统计学 (Medical Statistics)
第四章 常用概率分布 韩国君 教授.
Biostatistics 生物統計學 醫學影像處理實驗室.
第 6 章 统计量及其抽样分布 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学.
统计工具的使用方法 主讲人 陶育纯 统计工具的使用方法 主讲人 陶育纯
现代统计分析方法概述 2019/5/20 知识管理与数据分析实验室.
假设检验.
第七章 计量资料的统计分析.
授課內容: 共線性與虛擬變數 簡單線性迴歸模型: 政治大學行政管理碩士學程共同必修課 課程名稱:社會科學研究方法(量化分析)
抽樣分配.
Presentation transcript:

迴歸分析與軟體應用 林 國 欽 博士 商學與管理研究所 台南科技大學

內容綱要 統計概念與推論分析 迴歸分析 統計軟體應用

統計科學的基本概念 統計為一種量性研究的工具 資料—資訊—知識—智慧 (收集、整理、分析及解釋資料) 從複雜到簡化 從亂中取其規則性

統計分析的應用範疇 數理統計 政府管理 教育統計 生物、醫學、農業 物理、工程 經濟、管理 社會科學 精算學、保險 統計軟體計算

學習統計的基本策略 重視統計在日常生活的應用 看懂圖表 設計問卷 如何抽樣 如何決定樣本數 先講求應用再談理論 如何做實驗設計 如何利用電腦做分析 如何寫報告

常用重要的專有名詞 母(群)體(population): 研究者所欲研究對象的總集合。 母(參)數(parameter): 描述母體的一些未知的量數。 樣本(sample): 從母體取出的一個部分集合。 統計量(statistic): 從樣本求得的已知量數。 抽樣(sampling): 從母體取出樣本的方法。 推論(statistical inference): 根據樣本對母體做出結論。

抽樣的精神 要知道牛肉很老,不一定要吃掉整頭牛。 資料是統計分析的養份。 抽樣必然產生誤差-抽樣誤差。 誤差如水,真象若石, 水落而石出。  水落而石出。 重複做看看,看結果如何?

資料收集的方法 實驗法:實驗設計 控制情境(變數)、提供處 理、隨機分組。 問卷調查法: 操作問卷內容。 田野調查法: 與研究對象長時期觀察。 次級資料分析法: 官方、公司、網路公開資料 等。

資料型態 類別型(categorical) —名目尺度、順序尺度 連續型(continuous) —等距尺度、等比尺度 橫向型(cross-sectional) 縱向型(longitudinal) ※不同型態資料,應用不同統計方法分析

很重要的常態分配(Normal distribution) 英國數學家棣美佛de Moivre (1667-1754)於1733,最早提出常態曲線。德國數學家C. F. Gauss(1777-1855)廣泛的應用常態曲線於重覆測量誤差的分佈。所以常態分配亦稱高斯分配或稱常態曲線為誤差曲線。 ─在大部分的自然現象,均可用常態分配來描述。 ─在傳統統計推論的基本假設中,常要求母體須具備常態分配。

神奇的常態分配函數 高斯(1777-1853)

常態分布是對稱的,平均數和中位數都落在曲線的中間位置。 常態曲線(Normal Curve) 常態分布是對稱的,平均數和中位數都落在曲線的中間位置。 特別性質一 以試算表演練實例 s m 所以常態分布的平均數、中位數和眾數全都一樣。

常態曲線的分割 反曲點落在-s處 反曲點落在一個s處 特別性質二 可用視查法找到分布的標準差。 從中心點往兩測離開,圖形降得非常快, 以試算表演練實例 可是在兩側尾巴部分,離中心愈遠,曲線就降的愈慢。

標準差決定曲線的形狀 特別性質三 以試算表演練實例 s s m 平均數定位中心點 σ 愈大曲線分怖愈低闊

眾數 s m-3s m-2s m-s m m+s m+2s m+3s 尖峰點 中位數 等面積點 標準差 -3 2 3 -2 -1 1 平均數 以試算表演練實例 s 標準差 -3 2 3 -2 -1 1 m-3s m-2s m-s m m+s m+2s m+3s 平均數 平衡點

中央極限定理 (Central Limit Theorem) 不論母體為何種分配,只要樣本 數取得夠大,樣本平均數的分配 近似常態分配。 從常態分配所衍生的重要分配如下: t-分配 (W. S. Gosset,1876-1937) 卡方分配 (K. Pearson,1857-1936) F-分配 (R. A. Fisher,1890-1962)

現代統計學之奠基者 卡爾‧皮爾森(Karl Pearson) 每個分配都能用四個數值來衡量: 平均數—觀察值散佈的中央值。 變異數—觀察值偏離平均數的情形。 偏度—觀察值在平均數兩側堆積程度。 峰度—觀察值偏離平均數的速度。

統計推論--假設檢定 聶曼(J. Neyman) 、皮爾森 (E. Pearson) 2個假設、2個決策、  2個誤差及2個機率 顯著性檢定─指出效應的產生不是來自隨機機遇的原因。 統計報表中,p-值檢定,應注意下列幾個盲點: 1. 樣本數n愈大或資料有離群值(outlier)時,則p–值會愈小,愈顯著。 2.統計顯著性並不表示有實務顯著性。詳細觀察資料本身結構及散佈圖或找出母數的信賴區間是很有必要的步驟。

相關分析與迴歸分析 (Like Father Like Son) 相聯性(association):兩變數間, 若其中一個變數會隨著另一個變 數的改變而改變時,稱兩變數有 相聯性。 相關分析 相關並不代表因果關係─兩變數間的 關聯性,有時來自潛在變數(lurking variable)的影響。變數間的交絡 (compound)現象(效應混合難辨),無 法對因果關係作出正確的結論。從散 佈圖中的趨勢圖形斜率多少可了解兩 母體的相關程度。

變數的相關實例

相關係數 皮爾森相關係數(Pearson’s r),以r表示。 r值界於-l和l之間的量數,正值顯示變數之間有正相關,負值顯示負相關。|r|值顯示兩變數之間相關的強度。 ※當變數屬類別型時,史皮爾曼相關係數(Spearman’s r)可取代之。

變數間關聯分析之統計方法

迴歸分析 (Regression Analysis) 「迴歸」一詞源於1885,英國優生學家高登(Sir F. Galton ,1822-1911)所寫的論文“Regression towards mediocrity in hereditary stature” ---向中間值迴歸。 ※發現指紋俱唯一性的第一人

迴歸分析三大功能 做描述用--當迴歸模型建立後,描述自變數(X)如何影響因變數(Y) 。 做控制用—控制剛好與預測相反,先控制Y,再求如何輸入X。

迴歸模型的演進

類別自變數的迴歸分析(Categorical Independent Variables)

結語與建議 迴歸模型殘差假設的檢驗 (residuals analysis) 自變數共線性的問題 (multi-collinearity) [主成份分析(principle complement)、脊迴歸(ridge regression)] 非線性模型的考慮 (nonlinear models) 變數轉換的考慮 (variables transformation) 應用無參數模型 (nonparametric regression) 模型適合度檢驗 (goodness-of-fit test)

謝謝聆聽

References 1. D. Salsburg 著 葉偉文 譯 “統計改變了世界-The Lady Tasting Tea” 天下出版。 2. R. Rao 著 石堅‧李竹渝 譯 “統計與真理─怎樣運用偶然性” ,九章出版社。 3. 唐麗英,王春和 著 “Statistica –基礎統計分析”,儒林出版社。 4.林國欽, “統計軟體與應用”講義。 5.數學報告:數學家~~高斯 http://www.nhltc.edu.tw/~chchang/homework/90/social2/3.htm 6.林惠玲,陳正倉 著“應用統計學”3rd.,雙葉書廊。 7.D. Freedman , R. Pisani, R. Purves, and A. Adhikari. Statistics 2nd. New York: W. W. Norton & Company.