The Nature and Scope of Econometrics chapter one The Nature and Scope of Econometrics
I. What is Econometrics? 字面的意義: economic measurement Econometrics may be defined as the social science in which the tools of economic theory, mathematics, and statistical inference are applied to the analysis of economic phenomena. 數理經濟(mathematical economics)將經濟理論(本質為質性的探討)予以模型化(i.e. express economic theory in mathematical form or equation (or models) without regard to measurability or empirical verification of the theory),而計量經濟則予以驗證或測度。
II. The Methodology of Econometrics (1/8) 一般來說,計量分析包含以下步驟: Creating a statement of theory or hypothesis Collecting data Specifying the mathematical model of theory Specifying the statistical, or econometric, model of theory Estimating the parameters of the chosen econometric model Checking for model adequacy: Model specification testing (模型設定的檢定)
II. The Methodology of Econometrics (2/8) Testing the hypothesis derived from the model. Using the model for prediction or forecasting. 以下利用一個例子說明前述步驟,問題為:經濟情勢是否影響人們加入勞動力的決策。以失業率(UNR)作為經濟情勢的衡量變數,勞動參與率(LFPR)作為勞動參與的指標。 提出欲測試的理論或假說。根據勞動經濟理論,有兩個對立假說:discouraged-worker effect和added-worker effect,何者成立乃實證問題。
II. The Methodology of Econometrics (3/8) Collecting data(表1-1)。表1-1為失業率和勞動參與率的年資料,實證資料型態不外乎(1) time series data, (2) cross-sectional data, (3) pooled data (panel data)。 Mathematical model。建立研究變數之間的數學模型,將資料樣本先劃成分散圖(scatter gram)(圖1-1)有助於判斷,假設建立線性模型為 和 稱為參數(parameters) Econometric model。建立研究變數之間的計
II. The Methodology of Econometrics (4/8) 量模型。由於樣本並非由實驗控制產生,樣本點不可能全落在一直線上(有許多其他的因素會影響勞動參與率LFPR),為考慮這些其他因素和隨機因素,將數學模型增添一隨機誤差項(random error term) u 成為 這個計量模型稱為線性迴歸模型,此模型是基礎計量課程討論的重點。
II. The Methodology of Econometrics (5/8) Table 1 U.S. Civilian Labor Force Participation Rate (CLFPR), Civilian Unemployment Rate (CUNR), and Real Average Hourly Earnings (AHE82)* for the years 1980-2002.
II. The Methodology of Econometrics (6/8) Figure 1 Regression plot for civilian labor force participation rate (%) and civilian unemployment rate (%)
II. The Methodology of Econometrics (7/8) Estimating the parameters。根據資料樣本、計量模型與估計方法(本課程討論重點為普通最小平方法OLS),可以估計出 和 的估計值: CLFPR上的hat代表其為估計值,而非真值(圖1-1的直線即為根據以上估計結果所繪)。 Model specification testing。所使用的計量模型是否遺漏了重要的解釋變數、或是變數之間的關係是否妥適?
II. The Methodology of Econometrics (8/8) 薪資應該也是影響勞動參與率的重要因素,若將此變數納入模型中,則估計結果為: 與原本的模型比較,何者較佳?是否應納入薪資變數? 此即模型設定檢定的問題。 Testing the hypothesis。根據估計結果與估計式的抽樣分配(sampling distribution)檢定原先設立的假說。 Prediction or forecasting。What is CLFPR, given values of CUNR (and AHE82)?
III. The nature of data (1/3) 橫斷面資料(cross-sectional data) 橫斷面資料集包含某一特定時點,個人、家庭、廠商、城市、州、國家或是各種其他單位所組成之樣本。有時候在資料集中的所有單位並沒有精確的對應到相同的時點,比如說許多家庭被訪查的時間可能是一年中不同的星期,然而我們還是將之視為橫斷面資料集。橫斷面資料集的一個重要特性就是我們通常可以假設它們是從母體中隨機抽樣(random sampling) 而來。
III. The nature of data (2/3) 時間序列資料(time series data) 時間序列資料集包含一個變數或多個變數跨時間的觀察值,時間序列資料的例子包括股票價格、貨幣供給、消費者物價指數、國內生產毛額等。時間序列資料要注意資料收集時的資料頻率(data frequency),在經濟學中最常用的頻率是每日、每週、每月、每季,以及每年。時間序列資料不是隨機樣本,因此有不同的問題需要考慮,趨勢以及季節性將會是重要的。
III. The nature of data (3/3) 合併的橫斷面資料(pooled cross section data) 有些資料集同時擁有橫斷面和時間序列的特性。為了增加研究樣本數,可以透過合併兩年資料而形成一個合併的橫斷面資料。將各年的資料形成一合併的橫斷面資料通常在分析新政策之效果時很有效,我們可以在政策變動之前及之後來收集資料。 縱橫資料(panel or longitudinal data) 縱橫資料包含資料集中每一個橫斷面觀察點的時間序列資料。例如,某一群人十年的工資歷史資料。
IV. Outline of the course Review I & II Simple linear regression model (CH 2,3) Multiple linear regression model (CH 4) Functional forms and other related issues (CH 5) Dummy variable regression model (CH 6) Model specification (CH 7) Heteroscedasticity (CH 9) Autocorrelation (CH 10) Introduction to time series analysis (CH 12)