相關統計觀念復習 Review II.

Slides:



Advertisements
Similar presentations
20-Opening 統計學 授課教師:楊維寧 10Simple-R-Commands.
Advertisements

1/67 美和科技大學 美和科技大學 社會工作系 社會工作系. 2/67 社工系基礎學程規劃 ( 四技 ) 一上一下二上二下三上 校訂必修校訂必修 英文 I 中文閱讀與寫作 I 計算機概論 I 體育 服務與學習教育 I 英文 II 中文閱讀與寫作 II 計算機概論 II 體育 服務與學習教育 II.
聖若翰天主教小學 聖若翰天主教小學歡迎各位家長蒞臨 自行分配中一學位家長會 自行分配中一學位家長會.
第十三章 医学统计学方法的基本概念和基本步骤
手术切口的分级与抗菌药物的应用 贵阳医学院附属白云医院感染管理科 沈 锋
苏炳华 教授 上海第二医科大学 生物统计学教研室
「健康飲食在校園」運動 2008小學校長高峰會 講題:健康飲食政策個案分享 講者:啟基學校-莫鳳儀校長 日期:二零零八年五月六日(星期二)
估計的基本概念 估計量之性質 估計之方法 區間估計之基本概念 平均數之區間估計 樣本大小.
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
脊柱损伤固定搬运术 无锡市急救中心 林长春.
概率论与数理统计 课件制作:应用数学系 概率统计课程组.
第一章 緒論.
行政訴訟法 李仁淼 教授.
務要火熱服事主.
歡迎蒞校參訪.
作业现场违章分析.
蒙福夫妻相处之道 经文:弗5:21-33.
第六章 假设检验的基本概念.
平均数检定 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2012/7/6.
假設檢定.
Analysis of Variance 變異數分析
Population proportion and sample proportion
型II誤差機率的計算 Calculating Type II Error Probabilities
6.5滑坡 一、概述 1.什么是滑坡? 是斜坡的土体或岩体在重力作用下失去原有的稳定状态,沿着斜坡内某些滑动面(滑动带)作整体向下滑动的现象。
第六章 参数估计 §6.1 点估计的几种方法 §6.2 点估计的评价标准 §6.3 最大似然估计 §6.4 最小方差无偏估计
8.2 参数估计 §8.2.1 基本概念 一、估计量 估计值 人们往往知道随机变量(总体)的分布类型,但确切的函数形式并不知道,即总体的参数未知。参数估计就是要根据样本来估计出总体的未知参数。
一元线性回归(二).
第十章 兩母體之假設檢定 Inferences Based on Two-Samples:
分析化学教程 第二章 分析数据处理及 分析测试的质量保证 (1) 分析化学教程( 学年)
平均数检定 庄文忠 副教授 世新大学行政管理学系 计量分析一(庄文忠副教授) 2011/7/12.
第 3 章 敘述統計:數值方法.
第 5 章 樣本資料的數值分布.
Properties of Continuous probability distributions
Sampling Theory and Some Important Sampling Distributions
十一、簡單相關與簡單直線回歸分析(Simple Correlations and Simple Linear Regression )
簡單迴歸模型的基本假設 用最小平方法(OLS-ordinary least square)找到一個迴歸式:
Interval Estimation區間估計
第一章.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
第 3 章 敘述統計II:數值方法 Part A (3.1~3.2).
The Nature and Scope of Econometrics
Workshop on Statistical Analysis
Chap 9 Testing Hypotheses and Assessing Goodness of Fit
課程七 假設檢定.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
第 9 章 估 計.
聖本篤堂 主日三分鐘 天主教教理重温 (94) (此簡報由聖本篤堂培育組製作).
生物統計 1 課程簡介 (Introduction)
实验数据处理方法 王永刚.
Introduction to Basic Statistics
抽樣分配 Sampling Distributions
第八章 假設之檢定與信賴區間 陳順宇 教授 成功大學統計系.
Introduction to Basic Statistics
Chapter 04 流程能力與績效分析.
Chapter One 衝突與協商. Chapter One 衝突與協商 研讀本章後,你應能: 定義衝突 區別傳統的、人類關係的,以及互動的衝突觀點 比較任務、關係與程序衝突 概述衝突的過程 描述五種處理衝突的意圖 比較分配式與整合式的協議 確認協商過程中的五個步驟 說明協商中的文化差異 組織行為學.
Review 統 計 方 法 的 順 序 確定目的 蒐集資料 整理資料 分析資料 推論資料 (變量,對象) (方法:普查,抽樣)
Dr. C. Hsieh College of Informatics Kao yuan University
The Bernoulli Distribution
社会研究方法 第7讲:社会统计2.
商用統計學 Chapter 7 估計.
第二章 经典线性回归模型: 双变量线性回归模型
Review of Statistics.
Parameter Estimation and Statistical Inference
品質管理與實習 : MIL-STD-105E 何正斌 國立屏東科技大學工業管理學系.
Multiple Regression: Estimation and Hypothesis Testing
第七章 计量资料的统计分析.
基督是更美的祭物 希伯來書 9:1-10:18.
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
簡單迴歸分析與相關分析 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2019/8/3.
Gaussian Process Ruohua Shi Meeting
Presentation transcript:

相關統計觀念復習 Review II

The Key Concepts Statistical Inference Parameter Estimation Hypothesis Testing Point Estimation vs. Interval Estimation Confidence Interval Confidence coefficient and level of significance Properties of Point Estimator BLUE (線性最佳不偏估計式) Consistency

The Key Concepts Hypothesis Testing The Confidential Interval Approach The Test of Significance Approach Type I Error( ) and Type II Error ( ) t test and the p value

I. Estimation of Parameters The meaning of statistical inference (統計推論) 簡單地說,就是根據樣本來推論母體. Statistical inference is the study of the relationship between a population and a sample drawn from that population.

I. Estimation of Parameters Two branches of statistical inference Estimation(估計):我們可能對母體的某些特徵有興趣,這些母體特徵稱之為參數(parameter).欲利用樣本推論母體,第一步必須先對參數作估計,估計時需要估計式(estimator),估計式必須具有什麽特性才算是 “好”的估計式呢? Hypothesis testing(假說檢定):我們對母體參數值可能有一些事前的判斷或預期,而根據樣本所得到的估計值(在統計上)支持或不支持原來的假說呢?這是統計推論的第二步。

I. Estimation of Parameters 估計母體參數值(以母體 的估計為例) Point estimation(點估計) 計算樣本平均數的公式 稱為點估計式(point estimator). Interval estimation(區間估計) 根據估計式的抽樣分配可以建立 的區間估計:在給定之機率下, 會落於的區間為何?假設給定機率為95%,如何建立區間估計呢?

I. Estimation of Parameters 已知 ,假設母體 未知,以樣本變異數 取代,根據Review I 的說明,可知 為自由度n-1的t分配隨機變數,故可由t分配表建立區間估計.假設自由度=27 (圖1) (*) 上式即為 的interval estimator.

I. Estimation of Parameters Figure 1 The t distribution for 27 d.f.

I. Estimation of Parameters 統計上稱(*)式為 的95%信賴區間(confidence interval),而95%為信賴水準或信賴係數(confidence coefficient).(*)式的意義為: “ the probability is 0.95 that the random interval contains the true (該隨機區間包含母體真值的機率是95%) .”(the interval is random because it is based on and , which will vary from sample to sample). 當信賴水準提高,信賴區間變大.而(1-信賴水準)稱為顯著水準(significant level),習慣上以 來表示.

I. Estimation of Parameters Figure 2 (a) 95% and (b) 99% confidence intervals for μx for 27 d.f.

II. Properties of Point Estimator 為何採用樣本平均 作為母體期望值 的估計式呢?這是因為此估計式擁有一些統計上的良好性質. 性質1:Linearity 指估計式為樣本觀察值的線性函數. 顯然 為 的線性函數,符合性質1. 性質2:Unbiasedness(不偏) 指重覆隨機抽樣下,該估計式的期望值等於真實的母體參數值,以樣本平均為例,即 .

II. Properties of Point Estimator 性質3:Efficiency(效率性) If we consider only unbiased estimators of a parameter, the one with the smallest variance is called the best, or efficient estimator. Minimum-variance estimator的意義 比較兩個估計式:樣本平均和樣本中位數(median),兩者皆為母體期望值的不偏估計式,但樣本平均優於中位數,因前者估計式的變異數較後者為小. BLUE (best linear unbiased estimator):指所有線

II. Properties of Point Estimator An example of an efficient estimator (sample mean).

II. Properties of Point Estimator 性,不偏估計式中變異數最小者. 性質4:Consistency(一致性) 此為大樣本下(n大)的性質,正式的定義如下:令母體參數為 ,估計式為 ,則若下式成立,該估計式符合一致性 表示當樣本數趨近於無窮大時,該估計式等於母體參數(即估計式變異數趨近於零).以下圖來說,該估計式在小樣本下並非不偏,但隨著樣本數增加,趨近於不偏,且變異數減少.

II. Properties of Point Estimator The property of consistency. The behavior of the estimator X* of population mean μx as the sample size increases .

III. Hypothesis Testing 接著討論假說檢定,假設樣本數為28,樣本均數值23.25,樣本標準差1.7934, 如何根據28筆樣本資料進行檢定呢? 令欲檢定的虛無假說(null hypothesis)為 虛無假設之檢定乃相對於對立假設(alternative hypothesis),其形態為下列三種之一: , (one-tailed) (composite, two-tailed)

IV. Hypothesis Testing 檢定方法一:confidence interval approach 根據信賴區間部份的說明,可知在95%信賴水準之下, 的信賴區間為 ,不包含18.5,故拒絕虛無假設. 準則:信賴區間為acceptance region(接受域),若虛無假設之值落於信賴區間,則無法拒絕虛無假設;信賴區間以外為critical region, or the region of rejection(拒絕域),若虛無假設之值落於信賴區間以外,則拒絕虛無假設. 根據檢定結果,拒絕了 的虛無假設,這是否

IV. Hypothesis Testing 表示樣本一定不是來自期望值為18.5的母體呢?由於信賴水準為95%,我們並無法確定,也就是說,有可能母體期望值為18.5,而我們錯誤地拒絕了,此種錯誤地拒絕為真虛無假設(the error of rejecting a hypothesis)稱為型一誤差(type I error).反之若虛無假設為 ,則無法拒絕,此時同樣有可能樣本並非來自期望值為21的母體,此種錯誤地接受了非真虛無假設(the error of accepting a false hypothesis)稱為型二誤差(type II error).

IV. Hypothesis Testing 在樣本數給定之下,我們無法同時降低型一與型二誤差發生的機率,古典統計學假設型一誤差相對嚴重,因此檢定時,係在給定相當低的型一誤差水準(通常是1%或5%)之下來進行,此給定的型一誤差水準就是顯著水準 (例中=5%).故前例中我們有5%的機會錯誤地拒絕了 . 倘若將顯著水準降低(如由5%降為1%),則犯型一誤差的機率下降(信賴區間變大了),但同時錯誤地接受非真之虛無假設的機率(即型二誤差)也提高了.例如前例在1%顯著水準下,信賴區間 ,無法拒絕 .

III. Hypothesis Testing Example D.3. 樣本數20,樣本平均數6.5,樣本標準差2,顯著水準1%,檢定 against . 檢定方法二:Test of significance approach 直覺:已知 為自由度n-1的t分配隨機變數,根據樣本可計算出 和 ,再將虛無假設的數值(此例為18.5)代入 ,即可計算出t值.直覺上,若 愈接近於虛無假設數值(絕對差愈小), 愈小,愈傾向不拒絕虛無假設,反之若樣本平均值與虛無假設數值差距愈大, 愈大,愈傾向於拒絕虛無假設,那麼差異要多大(或 要多大)才夠顯著而拒絕虛無假設呢?這取決於所設定的顯著水準.

III. Hypothesis Testing 檢定量(test statistic):此例以t 檢定量 來檢定 ,倘若虛無假設為真,檢定量t值為2.6486.而在5%顯著水準下,critical t值為-2.052與2.052,此例t值大於2.052,表示拒絕虛無假設而犯型一誤差的真實機率小於5%,因此拒絕虛無假設.(換言之,若虛無假設為真,會得到t值2.6486的機率小於2.5%,即小於所設定的顯著水準,故拒絕虛無假設). p值的意義: ,the exact significance level of the test statistics. The smaller the p value, the stronger the evidence against .

III. Hypothesis Testing The t test of significance: (a) Two-tailed; (b) right-tailed; (c) left-tailed

III. Hypothesis Testing A summary of the t test.