Survey Sampling 問卷調查和訪談 Data Collection Survey Sampling 問卷調查和訪談
Survey Sampling Aim : Obtain information about large populations (母群體) by examining only a portion (樣本, Sample). 是否可推算母群體之可能特性,並作為決策之參考? Traffic, tax audits, quality control, census preparation,市場調查... Systematic enumeration of the beginning of the list is NOT a good idea, alphabetical, age-related, hour-related order. Random sampling guards against investigator bias. Above all, this randomness, as we will see allows an estimate of the error, (we can even design the sample size necessary to obtain a given precision). Population Parameters Numerical characteristics we are interested in. We will derive approximations of their values through estimates based on part of the population only: the sample. Population size N, sample size n. We will use x1, x2, x3,…,xN to denote the population numbers, they could be real integers, binary(dichotomous), or categorical.
市場調查的範圍 分析產品市場的大小 分析不同區域中的銷售良機與潛力 分析特定市場的特徵 從經濟觀點探尋影響銷售的各種因素 市場性質變化的研究 瞭解市場的最大需要量、掌握市場中競爭者的地位,以檢討自己公司的產品,在眾多的同類競爭商品中,所佔的分量與地位。 分析不同區域中的銷售良機與潛力 檢討公司在特定的銷售區域中,可能擴展的程度,及研究各區域之相對市場的有利機會。 分析特定市場的特徵 瞭解市場的特徵。如將高所得者所使用的產品銷售於低所得者的地區,當無法符合當地消費者的需要。 從經濟觀點探尋影響銷售的各種因素 如國民所得的高低,消費者信用情形與消費者利益等問題。 市場性質變化的研究 分析各區域市場相對性與重要性的變化,例如某市郊消費者生活型態的改變,所引起市場變化的問題等。 研究各階層消費者對商品欲求的變化 例如對高階層消費者而言,經由超級市場所銷售的商品,必須研究商品的包裝、色彩、商品服務及消費者欲求心理等,以制定有效的銷售計畫。
簡單隨機抽樣 Simple Random Sampling Definition: 母體中的每個元素均有相同的機率被抽中 There are C(N,n) samples taken without replacement. How is this done? Imagine, numbered billiard balls in urns. Old days : tables, now computer random number generator, based on uniform random number generator Composition of the sample is random (the labels are random) implies that the sample mean, the sample total... are random variables. The population mean is a number, the sample mean is a random variable whose accuracy as an estimate can be evaluated by a probabilistic analysis. Expectation and Variance of the Sampling Mean From sample mean we can also estimate the total if we know the population size. Xi's distribution is called the sampling distribution. Determines how accurately sample mean estimates population mean (m)?
Example Population N=393 short-stay hospitals, xi = # patients discharged during the month of January 1968. As a list of 393 values would have been useless, we can use histogram (into groups of 200) to present it. Population mean (average) is 814.6031 Population variance is 347,776 and std=589.7 Use SRS with n=16 to determines how accurately sample mean estimates population mean? The total number of possible samples 393 choosing 16 is around 1033. We will use simulation techniques, say create 500 samples of different sizes.
簡單隨機抽樣 缺點: 使用時機: 完整母體名冊不易取得,或取得成本很大時實行困難 當母體樣本單位過多時,抽樣作業相對上不便(如母體名冊 幾萬戶) 樣本分配分散,增加調查行政作業困難(如台灣地區住戶580萬戶要抽18000戶) 當樣本單位差異大時,樣本代表性恐有不足(如估計所得,抽到高所得或偏低所得) 使用時機: 母體內樣本單位不多,且有完備名冊可資編號 母體內樣本單位差異不太大時
分層隨機抽樣(Stratified Random Sampling) 將含有N個抽樣單位之母體,按照某種特性分成L個不重疊的組群,這些組群可稱為層(strata)。分層後再由各層中分別抽取樣本,此即為分層隨機抽樣。 優點: 樣本分配較均勻,可提高估計確度 可以分別得各層訊息,並做比較分析 各層可視情形採取不同之抽樣方法 便於尋找樣本跳動之來源(如連續性調查每季每月就業、失業、人力資源調查) 可在各層設立行政單位,以利調查方便 限制: a.分層變數之選取(分層特性)需多加注意 b.分層不能有重疊現象 c.分層後樣本資料之整理與估計較SRS複雜 使用時機: a.母體內樣本單位之差異較大時 b.分層後能達到層間變異大、層內變異小
集群抽樣(Cluster Sampling) 隨機抽樣時,選入樣本的不是個別的單位,而是一群一群的單位;選出部份的組別,並在被抽樣的組別中進行普查。 此法可減低抽樣成本,故大為盛行,但風險較大,容易發生抽樣偏差。 此法和分層抽樣看似類似,實則有很大不同,分層隨機抽樣是各層均需參與抽樣,在各層中採行隨機抽樣,個別抽取基本單位樣本;而集群抽樣則是隨機選取群組,選中的群再進行全查。 故使用時機和分層抽樣相反,必須群間變異小,而群內變異大。 另外,當群集內所含個體數不同時,亦會使誤差加大。
基本名詞 抽樣架構(Sampling frame):指整體抽樣單位的詳細名單,可供抽樣之用。共分三種型態: b.抽象的:無名冊,符合條件即有被抽樣之可能; c.階段式:分段抽樣時,依階段之不同,可產生不同之抽樣架構。 抽樣單位(Sampling unit):在抽樣架構上排列之名單,其個別單位就是抽樣單位。 樣本(Sample):從抽樣架構中抽取出之抽樣單位總和。 精確度(Precision)與準確度(Validity): 精確度乃用以衡量估計值精確可依賴的程度。準確度乃衡量母群體特性與實際母群體特性間的差異,兩者差異愈小,代表準確度愈高。 Variance versus Bias 抽樣誤差(Sampling error):因抽樣時樣本可能會偏離母群體,其間的差距稱為抽樣誤差,可用統計方法估計其大小。
基本名詞 信賴水準(Confidence level):以樣本估計值推論母群體實際值大小時,正確估計的概率有多少便稱為信賴水準,調查者以此表示正確估計程度。 容忍誤差(Tolerated error):在抽樣調查時,設定母體平均數上下各多少百分點作為估計的容忍誤差。精確度不可能百分之百,容忍誤差便是調查者事先設定的容忍範圍。
編製問卷的背景 如何去測量一個人對一件事的看法、態度? 如何測量智力? 「態度」這種既明顯可表現於外又無可名狀難以捉摸的心理行為,我們應該怎麼去測量他呢? 在李克特之前,塞斯通(Thurston )曾提出一套測量態度的方法。然而,要使用這套方法必須符合他一些統計先決條件,例如,敘述句的得分必須獨立於回答者的態度常態分配。(the scale values of the statements are independent of the attitude distribution of the readers who sort the statements。) 要符合這些個統計條件,整個編製計分的方式將變得極為複雜。 為了使整個問卷編制及計分方式簡便化,李克特在1932提出了一套新方法(李克特式量表,Likert-type scale),採用遠為簡便的多點量表。 對於一個事件的態度反應,究竟是固定不變的?還是具有某種傾向卻具有變動性的?李克特認為,對於一個事件的反應,應該是在某種範圍內變動的。 因此,多點量表詢問受測者對於一個事件反應的強度,而非一個問句中含了許多不同的反應敘述,詢問受測者一個絕對的反應。依照這樣一個理念,李克特設計了一套新的測驗
評量的基本概念 為能了解評量的性質、並適當使用評量工具進行研究時,必須先了解「尺度」(scale)、「信度」(reliability)、效度(validity)、以及「常模」(norm)四個基本概念。 尺度 「名目尺度」(nominal scale) 或「類別尺度」(categorical scale)。 主要功用是在區分類別,給每一個類別適當名稱,藉以辨識。譬如:人之「性別」可區分為「男性」與「女性」;婚姻狀況可區分為「已婚」與「未婚」;家長職業可區分分為「專業」、「半專業」、以及「非專業」三類;而「休閒嗜好」可區分為「戶外休閒」與「室內休閒」,或區分為「益智性活動」、「運動性活動」、以及「娛樂性活動」三類等 「順序尺度」(ordinal scale) 將事物依其特徵或屬性的大小、或多少的程度,排成順序或等級。 譬如,將十個參加演講比賽的學生依其成績高低自1排至10,這就是順序尺度的應用。 換個方式來看,如果以順序尺度測量四年乙班五十名學生的成績,請問小明的成績如何?答案可能是「小明是第五名」,而不是「小明的成績是80分」。 在等級或順序的排列中,可以比較個體之間的地位,可說明「大於」或「小於」的關係和差異,但個體之間的差異並無相同的單位。故全班第一名的成績與第二名成績的差異,未必等於第二名成績與第三名成績的差異。這個特徵要特別留意。
尺度 等距尺度(interval scale)或區間尺度 比例尺度(ratio scale) 等距尺度是一組具有連續性、單位又相等的數值。如果應用等距尺度來測量變項,乃是依其特徵或屬性之不同賦予不同的數值。使這些數值不僅顯示大小的順序,而且數值之間具有相等的距離。 等距尺度的主要特徵在於:(1)分數、(2)連續性、與(3)等距;而其主要功用則在於採用連續且等距的分數說明變項特徵或屬性的差異情形。 試想學生的國語科測驗成績,範圍是0分至100分。假如大中的成績是0分,這並不表示大中的國語科能力是空白。分數上的「0」是人為的零點,是研究者決定的一個點。因此,大中考了0分,只能解釋說,大中在這次測驗中,全部題目都答錯了,而不能說大中的國語能力是0。 國語科測驗小明考了90分,小華只有45分,那並不意味著小明的國語能力是小華的兩倍。這一個解釋上的限制要特別予以留意。 比例尺度(ratio scale) 比例尺度具有等距尺度的全部特徵,而且有「真正零點」。因此比例尺度的數值之間有相等的比例(ratio),不僅可以加減,也可以作乘除的運算。 如人的身高,可以採用比例尺度來測量,以0代表沒有高度,0以上的不同數值代表實際高度,而身高200公分即為身高100公分的兩倍。
實例:所得調查 名目尺度 順序尺度 等距尺度 比例尺度 你有所得嗎? □ 無 □ 有 你的所得水準是 □ 低所得 □ 中所得 □ 高所得 □ 無 □ 有 順序尺度 你的所得水準是 □ 低所得 □ 中所得 □ 高所得 等距尺度 你每月的所得是 □9,999元以下 □10,000~29,999元 □30,000~49,999元 □50,000~69,999元 □70,000元以上 比例尺度 你每月的所得是___________元
李克特五等尺度量表(Likert Scale) 問卷評量表(questionaire rating scale) 測量乃是將事物的特徵加以「量化」的過程,也是「量化研究」(quantitative research)不可缺少的程序。 管理學及行為科學等非常重要的研究工具之一。 可將預期程度、實際滿意程度等予以數值化,當這些特性具有數字的特點後,可得知受測人對該事物的偏好程度。 等級評價量表(rating scale) 五點量表設想將0%~100%分割成0%、25%、50%、75%、100%五個等分; 如「非常重要」 、「重要」、「普通」、 「不重要」、 「非常不重要」 。 問卷設計(questionaire design) 行銷研究(marketing research) 可視為關聯、依賴的成員所組成的組織, 共同意目標係促使某項產品或服務能順利地提供消費者使用。 信度分析 對同一或相似母體重覆測量所得結果之一致程度,一般最常以Cronbach α來衡量一致性 Cronbach's α值皆達0.85以上,顯示問卷信度良好。
信度(Reliability) 評量工具旨在蒐集現況資料,藉以了解事物或變項的特徵。 如何估量測量的可靠程度呢?大體上有兩個途徑可循, 最常使用的評量工具是問卷(questionnaire)調查 問卷是由多個題目所組成,用來衡量研究對象之特質,如使用頻率、產品偏好、重要度、滿意度、意向等。 如何估量測量的可靠程度呢?大體上有兩個途徑可循, 估量測驗結果的穩定性(stability) 再測信度:以同一測量工具實施二次測量結果的相關程度(即相關係數)來估量,相關程度愈高,表示測量結果愈穩定,亦即信度愈高;反之則反。 估量測驗題目的內部一致性(internal consistency)。 折半信度:針對一群受試者實施測量之後,將題目平均分為兩組(通常以題號為準,單號題一組,雙號題一組),分別計算受試者在各組的得分,並進一步求得這兩組分數的相關程度,然後依據「斯-布公式」(Spearman-Brown Formula)計算,所得結果即為信度係數。斯布公式如下: 測驗信度= 2×折半測驗分數之相關/[1+折半測驗分數之相關] Cronbach’s α信度:史丹福大學(Stanford University)柯隆巴克(Lee J. Cronbach) 教授於1951年所發展的α係數,依一定公式估量測驗的內部一致性,作為信度的指標。
Cronbach’s α信度 Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika. 16, 297-334. It is a measure of squared correlation between observed scores and true scores. Put another way, reliability is measured in terms of the ratio of true score variance to observed score variance. The theory behind it is that the observed score is equal to the true score plus the measurement error (xni = tn + eni). For example, I know 80% of the materials but my score is 85% because of lucky guessing. In this case, my observed score is 85 while my true score is 80. The additional five points are due to the measurement error. A reliable test should minimize the measurement error so that the error is not highly correlated with the true score. On the other hand, the relationship between true score and observed score should be strong. Cronbach Alpha examines this relationship.
Calculation of Cronbach’s α Cronbach's Alpha measures how well a set of items measures a single one-dimensional latent construct. When data have a multidimensional structure, Cronbach's Alpha will usually be low. (Xni = Tn + eni) Population: [Cov(T, S1≦i ≦k Xi)]2/[Var(T)Var(S1≦i ≦k Xi)] = k2Var(T)/Var(S1≦i ≦k Xi) =[ k/(k-1) ] ×[1- S1≦i ≦k Var(Xi)/Var(S1≦i ≦k Xi) ] k/(k-1) ×[1 - (S1≦i ≦k Var(item i)/Var(total score)] k:測驗題數 Suppose we have a 5 (k=5) item instrument and 15 (n=1,…,15) testers. 測驗分數之變異數:Use 15 total scores to figure out Var(total score). 個別題目分數之變異數:For each item, use 15 item scores to figure out Var(item 1),…, Var(item 5). 低信度:α<0.35, 中信度: 0.35<α<0.70,高信度: 0.70<α
效度(Validity) 效度是指根據測量結果推論變項特徵的適切性 效度證據 如採用某個學習動機量表,測量學生的學習動機。此時每個學生都得到一個「分數」,我們要根據這個分數來推論學生的學習動機。在此情況下,要先確定依據這個分數來推論學生的學習動機是否適切?是否有意義?是否有用?換言之,這個測量所得的分數能否真正解釋學習動機? 效度證據 內容關聯的效度證據 係從測量工具的內容來檢查,看看是否符合測量目標所預期的內容。 譬如說,一個學科成就測驗的預期內容是一學期的教材,但測驗題目所涵蓋的範圍卻只有第一課至第五課,其餘十五課的教材在測驗題目中都付之闕如。這樣的測驗顯然缺乏效度,因為測量的內容未盡周延完整,故測量的結果無法有效推論全學期的學習成就。 構念關聯的效度證據 構念(construct)是一種假設性的實體,是學者或研究者基於學術的目的,為說明一個假設存在的屬性或特徵,而精心創造或借用的名稱。 如針對「智力」這個構念進行測量時,因智力理論提示智力隨年齡而發展的原則,故智力測量的結果應顯示測量分數隨年齡遞增的現象,始符合智力的理論。唯其如此,才能確定此一智力測驗適切有效。換言之,欲從構念的分析來考驗測量工具的效度時,須以相關的理論為分析檢驗的架構和依據。
效度證據 效標關聯的效度證據 此類效度證據之蒐集係以其他測量為標準(習稱效標),將測量結果與效標作一比較,若彼此相關程度愈大,顯示效度愈高,反之亦反。 如果這種比較係以受試者受測一段期間後的實際行為表現為效標,則稱為「預測性效度證據」(predictive evidence of validity);如果以受測時的其他資料(含測驗)為效標,則稱為「同時性效度證據」(concurrent evidence of validity)。 舉例來說,對一群兒童實施創造力測驗,測定每名兒童創造力的高低,經過一段期間(也許是幾個月,甚至是好幾年),看看這些受試的兒童有何具體的創造性行為表現。如果兒童的測驗分數與創造行為表現有密切相關,顯示測驗結果足以預測創造行為,因此效度高;若測驗分數與創造行為毫不相關或相關很小,那麼效度就低。這樣的資料就是「預測性效度證據」。
研究「X世代」消費者對行動電話的購買行為 通訊業的發展也因電信自由化與市場開放競爭而膨勃 透過問卷調查與統計分析,探討高雄地區己擁有行動電話之「X世代」消費者之購買行為的有何差異。 選擇高雄地區三大商圈進行問卷調查。 問卷分析 依因素分析的結果,將母體分為四個族群,包括行先鋒派、精挑細選派、速戰速決派及紳士淑女派四個集群。 此集群的特質與人口變數為: 流行先鋒派-追求時髦、思想前衛 精挑細選派-精打細算、積極主動 速戰速決派-意見領袖、重視時間 紳士淑女派-傳統保守、尊重他人。 發現高雄地區「x世代」消費者 選購行動電話的主要動機前三名為:1.方便連絡2.業務需要3.價格合理 選購時各項影響因素為1.品牌口碑2.電視廣告3.親戚朋友 使用行動電詁的三大品牌分別為1.諾基亞2摩托羅拉3.易利信 各屬性之重要程度分別為1.收訊品質2.售後服務3行動電話防竊保護。