Presentation is loading. Please wait.

Presentation is loading. Please wait.

Statistics for Business & Economics

Similar presentations


Presentation on theme: "Statistics for Business & Economics"— Presentation transcript:

1 Statistics for Business & Economics
統計學導論 Statistics for Business & Economics Chapter 1 第一章 Introduction and Data Collection 統計學導讀

2 教學重點綱要 1. 統計學的定義 2. 統計學的應用 3. 敘述統計與推論統計的區分與比較
1. 統計學的定義 2. 統計學的應用 3. 敘述統計與推論統計的區分與比較 4. 定義統計術語:母體 (population), 樣本(sample),變數( variable), 母數(parameter), 統計(statistic) 5. 資料的類型 資料的來源 抽樣方法

3 腦筋轉轉彎 根據銘傳大學統計系調查得知,20歲大學男子100公尺短跑的平均成績為12.7秒. 本班同學的100公尺短跑平均成績為何?
你該如何去得到此答案? 你認為本班同學與受調查大學同學的跑步成績是否不同?

4 腦筋轉轉彎 根據某報紙調查得知,大學生罹患近視的比例高達八成以上。 本班同學罹患近視的比例為何? 你該如何去得到此答案?
你認為本班同學與受調查大學同學罹患近視的比例是否不同? 你認為銘傳大學同學罹患近視的比例為多少?你又該如何來得到此答案呢?

5 統計 學簡介 3

6 何謂統計學? 1. 資料處理與分析的科學 2. 包括: 收集資料 資料的分類 處理及組織資料 總結資料 分析資料 解析資料作適當的推 論
1. 資料處理與分析的科學 2. 包括: 收集資料 資料的分類 處理及組織資料 總結資料 分析資料 解析資料作適當的推 論 :1, 1, 3 統計統計 統統忘記 統統要記

7 何謂統計學? 了解明白 目的 協助作決策 1. 資料處理與分析的科學 2. 包括: 收集資料 資料的分類 處理及組織資料 總結資料 分析資料
1. 資料處理與分析的科學 2. 包括: 收集資料 資料的分類 處理及組織資料 總結資料 分析資料 解析資料作適當的推論 了解明白 :1, 1, 3 目的 協助作決策

8 統計學的應用 會 計 稽查 成本分析 管理 人事評估 品質改善 財務 趨勢分析 預估未來 行銷 客戶喜愛取向 市場評估 7

9 統計方法的分別 統計方法 敘述統計 推論統計

10 敘述統計 1. 包含 2. 主要目的 $ 資料收集 資料處理與呈現 資料特色與總結 將資料作最佳的呈現 X = 30.5 S2 = 113
1. 包含 資料收集 資料處理與呈現 資料特色與總結 2. 主要目的 將資料作最佳的呈現 25 50 Q1 Q2 Q3 Q4 $ X = S2 = 113

11 推論統計 1. 包含 估計 假設與檢定 2. 目的 根據樣本資訊對未知母體母數作推論或下決定 母體(Population)?

12 統計術語簡介 20

13 統計術語簡介   Population 1. Population(母體):所有合於研究個體總集合 母體平均年齡,
2. Variable(變數): 母體因個體差異會隨之變動的特徵性質 3. Sample(樣本):母體的子集合 4. Parameter(母數): 描述母體變數的總結數 5. Statistic(統計):描述樣本變數的總結數 Population 母體平均年齡,  = 19.2 21 19 20 18 21 19 樣本平均年齡, X = 20 Sample 年齡(變數) 9

14 請就下列各子題說明其母體為何? 對臺北市市長選舉所舉辦的選民意向調查。 行政院勞工委員會調查遭遇職業災害勞工概況。
台灣地區遊覽車營運狀況調查。 台灣地區養豬頭數專案調查。 台北市全部具有投票權的市民。 台灣地區全體遭遇職業災害勞工。 台灣地區經營遊覽車營業者。 台灣地區全體毛豬飼養戶所養之豬。

15 統計資料的分類與尺度 資料 量化 質化 區間 比例 名目 順序 22

16 資料分類範例 Qualitative質化資料 Quantitative量化資料 Nominal名目尺度 Ordinal順序尺度
你的血型為何? __ A __B__ AB __O Ordinal順序尺度 你喜歡統計學嗎? (非常喜歡,喜歡, 普通, 不喜歡) Quantitative量化資料 Interval區間尺度 現在室內溫度幾度? ___ (攝氏) Ratio比例尺度 你有多高? ___ (公分) 23

17 動動腦想一想 下列資料為何種資料;類別? 4. 智商 IQ 1. 性別 5. 考試成績 2. 體重 6. 考績 3. 車行速度
1. 性別 男性, 女性 2. 體重 58, 71, 48,….. 3. 車行速度 40, 80, 60,…... 4. 智商 IQ 78, 120, 95,…... 5. 考試成績 78, 65, 92, 49,….. 6. 考績 甲, 乙, 丙,….. 1. Gender = categorical - nominal 2. Weight = numerical - continuous - ratio 3. Auto Speed = numerical - continuous - ratio 4. Temperature = numerical - continuous - interval 5. # Siblings = categorical - ordinal 6. Letter Grade = categorical - ordinal 26

18 資料的收集 20

19 資料的來源 資料來源 直接第一手 間接第二手 實驗取得 問卷調查 觀察取得 別人發表 33

20 何謂原始資料?次級資料? 原始資料是指研究者專為目前的研究計畫所蒐集的資料。次級資料是指由其他來源所蒐集的資料,但亦能為目前的研究所引用。
一般而言,為了節省成本,在資料的蒐集程序上,應就各種來源或管道蒐集次級資料以供目前的研究使用,如若仍有不足之處才考慮原始資料的蒐集。

21 原始資料蒐集方式有那些 調查(survey):所謂調查是指透過訪問員的當面訪問,電話訪問,或郵寄問卷的方式所蒐集的資料。此種資料蒐集方式是最常見的一種。 觀察(observation):觀察是由研究者對所研究的事物進行觀察,以了解該事物的狀況。例如觀察某十字路口旳各種車流況,可以由數位調查人員以計數器計數在不同日期,時段計數各型車輛經過該十字路口的數量。 實驗(experiment):實驗是指在設定的條件或情形下,從事實際的試驗以取得資料的方式。由於必須在特定的條件下進行,因此較常見的實驗有藥廠在新藥申請批准上市前所做的實驗。以所得到旳資料來檢定該藥的藥效。

22 優點: 調查--電話訪問的優缺點 缺點: 無法涵蓋新近申請的用戶 某些用戶因故已停用原電話號碼 易監控訪問過程
用戶要求不能將電話號碼刊於電話號碼簿內 受訪對象可能沒有電話 很難進行需時較久之大型問卷 尤其有關圖示說明,或需觀察判斷的問卷,都無從得知 優點: 易監控訪問過程 快速、省時、費用較省 答覆問題時,較不會產 生尷尬

23 優點: 調查--郵寄問卷的優缺點 缺點: 成本較低 不會有訪員素質差異,造成問卷填答偏差 可得到較正確資訊 回收慢,甚至於『二次』催收
更嚴重的是,回收率低 產生『問題』先後次序未按設計原意填答的偏差 影響填答正確性 優點: 成本較低 不會有訪員素質差異,造成問卷填答偏差 可得到較正確資訊

24 優點: 調查--當面訪問的優缺點 缺點: 可得到更深入的訊息 回收率提高 不明暸處可當面解說 調查人員可當面察言 觀色 成本提高
不同素質的訪員,對問題有不同解說,因此可能對受訪者產生不良的影響,例如:誤導、曲解 訪員的虛應敷衍 優點: 可得到更深入的訊息 回收率提高 不明暸處可當面解說 調查人員可當面察言 觀色

25 何謂問卷? 為了蒐集與研究主題有關的各項資料,不論是採行訪員面訪、電話訪問或郵寄方式,都必須為調查者準備好蒐集資料用的格式或表格。

26 問卷範例一 個人基本資料 姓 名:  男 女 生 日:民國 年 月 日 職 業:學生工商軍公務人員教育 自由業家管其他
姓 名:  男 女 生 日:民國 年 月 日 職 業:學生工商軍公務人員教育 自由業家管其他 婚姻狀況:未婚 己婚(小孩有 無) 教育程度:小學 國中 高中 大專 研究所博士

27 問卷範例二 1。您購買本產品的原因為何?(可複選) 外觀設計 可上WAP 有PDA功能 2。請問您對本產品的整體滿意度?
超大螢幕 有雙語辭典 可收發    很多遊戲 功能超強  其他 2。請問您對本產品的整體滿意度? (0為最差,10為最好) 3。請問本手機是您的第幾隻手機?  第1支 第2支 第3支 第4支以上

28 問卷範例一 個人基本資料 姓 名:  男 女 生 日:民國 年 月 日 職 業:學生工商軍公務人員教育 自由業家管其他
姓 名:  男 女 生 日:民國 年 月 日 職 業:學生工商軍公務人員教育 自由業家管其他 婚姻狀況:未婚 己婚(小孩有 無) 教育程度:小學 國中 高中 大專 研究所博士

29 問卷設計的七個步驟 確認調查的目的,應蒐集哪些資料,以及蒐集來的資料擬使用哪些統計方法進行分析。 決定調查方式。
決定問問題及回答時所使用的型態或格式。 決定問題所使用的文字表達字眼。 決定問題順序及問卷整體安排。 考量問卷訴求的最大化。 進行問卷的預先測試,修正及問卷最後定案。

30 何謂前導性的問題?何謂引導性的問題? 所謂前導性問題(Leading Question)指在問題中隱含或提示受訪者填問卷的答案。
設計問卷時,在排列順序上以將相同問題排放在一起為宜,並以簡單易答的問題作為問卷的起頭,此為引導性問題(Lead-in Questions),目的在獲得受訪著的認同。

31 問卷預先測試的目的 預先測試(Pretest)的目的在於藉由測試受訪者的填答中找出是否有語意混淆的題目,或是問題選項多餘或不周延的問題。接受預先測試的人數不用太多,但每位受訪者所面對的各項疑點或填答的困難都應深入探討,並對問卷進行必要的修正。

32 抽樣調查設計及方法 Sample Survey Designs
9 4

33 使用抽樣調查的原因 1. 樣本可能以破壞或無法再使用 品管Quality control
1. 樣本可能以破壞或無法再使用 品管Quality control 2. 得到可信賴的精確程度Accurate & reliable results 3. 實用上原因 節省時間 節約花費 Pragmatic Reasons If Chrysler wished to census past purchasers?reactions, millions of car buyers would have to be contacted Accurate & Reliable Results Reasonable accuracy though not perfect - sampling error! May be more accurate than census since less chance of nonsampling errors (e.g., data entry) Bureau of the Census uses samples to check the accuracy of the US Census. If the sample shows possible source of error, the census is redone. Destruction of Test Units e.g., Mean Life of Light Bulbs 40

34 常見的各種的抽樣方法Types of Samples
Probability Samples Selection is based on chance Subjects are chosen based on some known probabilities Eliminates or reduces bias Random refers to procedure not the data: The outcome cannot be predicted because it is dependent upon chance Non Probability Samples Do not have above characteristics Done for time and convenience 51

35 簡單隨機抽樣 Simple Random Sample
1. 母體中每一個樣本點均有相同機率被抽中 2. 抽出某個樣本後不影響另一個樣本抽出的機率(獨立性) 3. 經常先列樣本名冊後用電腦產生隨機數或隨機表抽選 Simple Random Use random number table Number of digits is determined by population size 54

36 簡單隨機抽樣 (simple random sampling)
1. 母體名冊之取得及編號 2. 原則簡單、客觀取樣、樣本具有代表性 3. 例: 臨床實驗之病歷卡資料查核工作 彩券抽獎(lottery) 4. 隨機數字表的製作問題(pattern出現) 5. 統計理論之磐石 抽樣分配與樣本值之落點位置

37 系統抽樣 Systematic Sample
1. 將所有樣本列冊以序號排列,先隨機抽取第一個樣本,接著每隔K個樣本抽取下一個樣本 2. 間隔數K的求法 母體的個數 Population size 樣本的個數 Sample size 3. 常用於電話抽樣 Systematic Requires all population elements Bias may occur due to periodicity In the telephone book example, unlisted numbers will not be found Example: Sampling frame is 100 individuals. You want to select 20. Select first name by random number, then every 5th person. 58

38 系統抽樣 (systematic sampling)
2. 第一段內隨機選取某一特定位置 3. 其餘段內選取相同對應位置 4. 例: 生產線上取樣通常以時間為分段 執行方便; 電話簿之分區段(每數頁特定點) 5. 母體內特定結構會影嚮樣本結果問題 (例如時間性之循環)

39 分層抽樣 Stratified Sample
1. 將母體區分為數個strata 層之間互斥且周延 層內性質相近 層與層之間差異明顯 All Students Commuters Residents Stratified Assures 1. Sample reflects population in terms of criterion used for stratifying. 2. More efficient sample - sampling error is reduced. Example: College has 70% on-campus students and 30% commuters. A 100 student survey would get close to 70 on-campus students and 30 commuters. A simple random survey might get 60 on-campus and 40 commuting students. Similar to Quota sampling except that a simple random sample is drawn from each strata. 2. 從每一層中簡單隨機抽取若干樣本作為該層的代表,再將所有層總結集合 Sample 61

40 分層抽樣 (stratified sampling)
1.母體依持性分隔數個部分(層) 2. 每層內同質性高; 各層之間異質性高 3. 各層內以簡單隨機抽樣行之(依層大小比例抽層之樣本數) 4. 例: 評估某藥對氣喘病人之療效(年齡作分層) 調查大學生使用電腦之時間(系作分層) 5. 整個樣本及各層樣本皆可分析

41 群集抽樣 Cluster Sample 群集間互斥且周延 群集與群集間差異小 群集內類似母體
Companies (Clusters) 1. 將母體區分為多個群集clusters 群集間互斥且周延 群集與群集間差異小 群集內類似母體 Cluster Idea is to sample economically yet retain characteristics of probability sample. Ideally, cluster is as heterogeneous as the population. Often, characteristics of elements in cluster may be similar. Sample 2. 隨機抽取數個clusters,並將抽中的群集內每個樣本或部份樣本均抽樣調查 64

42 群集抽樣 (cluster sampling)
1. 母體依特性分成不同群集 2. 每群集內差異大;不同群集之相同性高 3. 例題: 紐約市街道之每一個block為一個群集 倉庫內不同批號(群集)之相同藥品抽樣查驗藥效 健保局對醫院查核健保資料(一間醫院為一個群集)

43 非機率隨機抽樣 Non-probability Samples
65

44 非機率隨機抽樣Non-probability Samples
判斷抽樣Judgment 根據經驗選取樣本代表 例如: 市場測試 定額抽樣Quota 類似於分層抽樣但不為隨機Similar to stratified sampling except no random sampling 便利抽樣Chunk (convenience) 使用最經濟的方式取得樣本 Judgment A fashion manufacturer selects key accounts to predict what will sell next season Quota Advantages are speed of data collection, lower costs, and convenience. Often used in laboratory experiments It is difficult to find a sample of the general population willing to visit a laboratory Chunk (Convenience) Street interviews at election time. Views represent supposedly the entire population. Need impressions of text book in an hour. Use this class to represent all students. 67

45 四種基本抽樣方法 800員工大公司欲了解dental plan花費. 想抽樣本32位員工, 唯回收率為80%.
每人都有一個信箱. 該公司有25%為管理階層, 全公司分為十個單位(假設人數一樣). 要抽多少人?用四種不同方法,如何抽樣?

46 四種基本抽樣方法 (續) 假設回收率80%, 須抽40人以獲得32個樣本 簡單隨機抽樣 系統抽樣
員工編號( ), 使用隨機數表40次的抽樣 該40人即為一組隨機樣本(a random sample) 系統抽樣 800個信箱分40區段; 每20個信箱為一區段 第一個區段, 使用隨機數表抽第一個樣本 剩餘區段, 相同位置抽樣

47 四種基本抽樣方法 (續) 分層抽樣 分群抽樣 管理階層和基層員工為兩個stratum 40個樣本, 依管理階層和基層員工的%抽樣
管理階層隨機抽10人,基層員工30人 分群抽樣 十個單位(clusters), 每單位80人 隨機抽一個樣本群集後, 再隨機抽40人 或是: 隨機抽兩個樣本群集, 各隨機抽20人 (代表性可能高些)

48 美國1948年總統選舉 配額抽樣 1. Dewey(紐約州長) v.s. Truman(現任總統)
2. 選舉民調: Crossley, Gallup, Roper, … 3. 抽樣方法: 配額抽樣 4. 選前及發佈前: 民調預測Dewey將勝選 5. The Chicago Tribune報紙早版己印好勝選

49 Highlight if > or <3%
美國1948年總統選舉 (續) 配額抽樣 全國 Gallup Roper 性別 男 年齡 50以上 種族 白 Highlight if > or <3%

50 美國1948年總統選舉 (續) 全國 Gallup Roper 教育 國中以下 43.5 35.3 27.5
教育 國中以下 高中 大學 服役 榮民 非榮民 工會(男) 會員 非會員 有效樣本人數 , ,501

51 美國1948年總統選舉 (續) 1. Crossley, Gallop, 和Roper等重要民調機構選前預測Dewey將勝選
2. The Chicago Tribune己印好勝選報紙 Dewey Truman 選舉結果 % % Crossley Gallop Roper

52 美國1948年總統選舉 (續) 4. 該次選舉結果和民調預測相反 5. 機率抽樣開始盛行; 隨機樣本代表母體
6. 以機率抽樣, 預測錯誤率反而降低 1950年以前, 24次全國選舉以配額抽樣者且樣本數為3250結果平均錯誤2.3%; 1950年以後17次全國選舉以機率抽樣者且樣本數為1500結果平均錯誤1.5%;

53 美國1948年總統選舉 (續) 1. Crossley, Gallop, 和Roper等重要民調機構選前預測Dewey將勝選
2. The Chicago Tribune己印好勝選報紙 Dewey Truman 選舉結果 % % Crossley Gallop Roper

54 美國1948年總統選舉 (續) 全國 Gallup Roper 教育 國中以下 43.5 35.3 27.5
教育 國中以下 高中 大學 服役 榮民 非榮民 工會(男) 會員 非會員 有效樣本人數 , ,501

55 美國1948年總統選舉 (續) 1. Crossley, Gallop, 和Roper等重要民調機構選前預測Dewey將勝選
2. The Chicago Tribune己印好勝選報紙 Dewey Truman 選舉結果 % % Crossley Gallop Roper

56 Highlight if > or <3%
美國1948年總統選舉 (續) 配額抽樣 全國 Gallup Roper 性別 男 年齡 50以上 種族 白 Highlight if > or <3%

57 美國1948年總統選舉 (續) 1. Crossley, Gallop, 和Roper等重要民調機構選前預測Dewey將勝選
2. The Chicago Tribune己印好勝選報紙 Dewey Truman 選舉結果 % % Crossley Gallop Roper

58 抽樣所產生的誤差 Errors Due to Sampling
Coverage (Frame) Error Sampling Error Frame Error The sampling frame is also called the orking population. Frame error is the discrepancy between population and sampling frame. e.g., Not all students may be in phone book Sampling Error Sampling units may not perfectly represent the population. All samples vary. Sampling error is a function of sample size Systematic (Nonresponse & Measurement) Error Nonresponse, badly worded questions, interview error. Nonresponse & Measurement Error Actual Sample Sample Frame (Students in Phone Book) Total Population (Students) Planned Sample (Selected Students) 68

59 何謂編校?在編校的過程中可能遇到哪些狀況?
編校(Editing)是指對魁及的原始資料找出錯誤予以更正,或對遺漏值進行探究及處理的過程。在編校的過程中可能遇到的狀況有: 問卷填答的字跡模糊難辨 訪問員捏造問卷填答內容 填答問卷內容前後不一致 填答不完整

60 資料整理的三項工作 編校:是只對所蒐集的原始資料找出錯誤予以更正,或對遺漏值進行探究及處理的過程。
編碼:是指將問卷的答案選項以字母或數字等代碼來表示,以便於資料的整理與分析。 列表:問券資料經過編校級編碼程序後,進一步將資料按不同目的予以列表。

61 目前使用的統計軟體 MINITAB STATISTICA SAS S-PLUS SPSS SYSTAT BMDP STATGRAPHICS
EXCEL STATISTICA S-PLUS SYSTAT STATGRAPHICS

62 總結 1. 統計學的定義 2. 統計學的應用 3. 敘述統計與推論統計的區分與比較
1. 統計學的定義 2. 統計學的應用 3. 敘述統計與推論統計的區分與比較 4. 定義統計術語:母體 (population), 樣本(sample),變數( variable), 參數(parameter), 統計(statistic) 5. 資料的類型 資料的來源 抽樣方法

63 關於本課程... 請你靜下來想一想: 1. 你此堂課學到的最重要的關念為何? 2. 是否還有相關問題與疑問? 3. 如何改善今後的學習?
1. 你此堂課學到的最重要的關念為何? 2. 是否還有相關問題與疑問? 3. 如何改善今後的學習? As a result of this class, you will be able to... 70


Download ppt "Statistics for Business & Economics"

Similar presentations


Ads by Google