第 四 章 迴歸分析應注意之事項.

Slides:



Advertisements
Similar presentations
人的性别遗传 合肥市第四十九中学 丁 艳. 男女成对染色体排序图 1 、男性和女性各 23 对染色体有何异同 ? 哪 一对被称为性染色体 ? 2 、这两幅图中,哪幅 图显示的是男性的染色 体?哪幅图显示的是女 性染色体? 3 、图中哪条染色体是 Y 染色体?它与 X 染色体 在形态上的主要区别是.
Advertisements

弟子规 带读简说. 一、弟子规之名称由来 原名【训蒙文】 为清朝康熙年间秀才李毓秀所作。 后经贾存仁修订改名为【弟子规】。
大学物理实验 第一讲 南昌大学物理实验中心 2013年2月.
莲 :荷花 芙蓉 芙蕖 晓出净慈寺送林子方 (宋) 杨万里 毕竟西湖六月中, 风光不与四时同。 接天莲叶无穷碧, 映日荷花别样红。
窦娥冤 关汉卿 感天动地 元·关汉卿.
1、一般地说,在生物的体细胞中, 和 都是成对存在的。
辨性别 A B. 辨性别 A B 第三节人类染色体与性别决定 昌邑市龙池初中 杨伟红 学习目标 1.理解人的染色体组成和传递规律。 2.解释人类性别决定的原理。 3.通过探究活动,解读数据了解生男生女的比例。
荃灣區旅游景點 成功組 全程制作人:游恒延.
第五章 主张超尘绝俗的 佛家.
人教版语文 三年级下册 语文园地四 作者:佚名 来源:网络.
问卷调查的规范与技术 问卷调查的规范与技术.
任务二 了解中国茶文化的形成 毛世红
单元二 走向高峰的中华文明 ——秦汉至宋元时期
品读论语之四---- 巧言令色非君子.
南京师范大学数学科学院 涂荣豹 中 国 数 学 教 学 的 继 承 与 发 展 南京师范大学数学科学院 涂荣豹
知其不可而为之.
一、平面点集 定义: x、y ---自变量,u ---因变量. 点集 E ---定义域, --- 值域.
第一讲: 春江花月夜 张若虚.
七(7)中队读书节 韩茜、蒋霁制作.
中国画家协会理事、安徽省美术家协会会员、 工艺美术师、黄山市邮协常务理事余承平主讲
第二课 扬起自信的风帆 我能“行”.
第二章 语音 第六节 音变 轻 声1.
《考试大纲》对本考点提出的能力要求是:识记现代汉字的字形。据此,高考对汉字的笔画、笔顺、造字法等内容均不作考查,只考查现代使用的汉字字形的识记能力。命题的依据是《现代汉语常用字表》,包括2000个常用字和1000个次常用字。考查重点为词语(包括成语)中的同音字、音近字、形近字。本考点的能力层级为A。
第三课 走向自立人生.
黃金比例.
郑伯克段于鄢 ——选自《左传》.
声调.
小池 杨万里 泉眼无声惜细流, 树阴照水爱晴柔。 小荷才露尖尖角, 早有蜻蜓立上头.
爱 莲 说 周敦颐 爱 莲 说 周敦颐 水陆草木之花,可爱者甚蕃。晋陶渊明独爱菊。自李唐来,世人甚爱牡丹。予独爱莲之出淤泥而不染,濯清涟而不妖,中通外直,不蔓不枝,香远益清,亭亭净植,可远观而不可亵玩焉。 予谓菊,花之隐逸者也;牡丹,花之富贵者也;莲,花之君子者也。噫!菊之爱,陶后鲜有闻。莲之爱,同予者何人?牡丹之爱,宜乎众矣。
中 国 服 装 史.
父亲的菜园 王树槐 引导者:江山市长台小学 朱丽云.
江西 6、下列关于名著的表述,不正确的一项是
语文版九年级(下) 多媒体课件.
管理学基本知识.
汉字的构造.
诵读欣赏 古代诗词三首.
滁州学院首届微课程教学设计竞赛 课程名称:高等数学 主讲人:胡贝贝 数学与金融学院.
Xiàn lù zuàn 陷入 忙碌 攥着.
第九章 多元函数微分法 及其应用 一元函数微分学 推广 多元函数微分学 注意: 善于类比, 区别异同.
“海鸥老人”——吴庆恒.
樱花.
色 弱 與 色 盲.
鱼咬尾 教师 广州市天河区先烈东小学 周正翔.
宠物之家 我的宠物性别? 雌(♀) or 雄(♂) 第一阶段:我的宠物我做主 第二阶段:宠物“相亲记” 第三阶段:家族诞生
拾貳、 教育行政 一、教育行政的意義 教育行政,可視為國家對教育事務的管理 ,以增進教育效果。 教育行政,乃是一利用有限資源在教育參
课标教材下教研工作的 实践与思考 山东临沂市教育科学研究中心 郭允远.
导入新课: 莲花,自古以来就被人们看作是美丽圣洁的象征。我们一起先来欣赏一下莲的形象,然后请同学说说你觉得莲花美在哪里。
課程銜接 九年一貫暫行綱要( )  九年一貫課程綱要( ) 國立台南大學數學教育系 謝 堅.
2.4 二元一次方程组的应用(1).
贴近教学 服务师生 方便老师.
六年级 语文 下册 第四单元 指尖的世界.
咏 柳 南昌凤凰城上海外国语学校 马金根.
(浙教版)四年级品德与社会下册 共同生活的世界 第四单元 世界之窗 第二课时.
鸿门宴.
正比與反比 大綱: 比與比值 比的運算性質 比例式 比例式的運算 蘇德宙 台灣數位學習科技股份有限公司.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
皇帝的新装 知识窗口 整体感知 合作探究 总结提高 创新发展. 皇帝的新装 知识窗口 整体感知 合作探究 总结提高 创新发展.
党员干部要争做社会主义 社会公德的表率 党员干部要争做 社会公德的表率 中共河南省委党校 周海涛.
导入新课 在《数学3》中,我们对两个具有线性相关关系的变量利用回归分析的方法进行了研究,其步骤为: 画散点图 求回归直线方程
两个变量的线性相关 琼海市嘉积中学 梅小青.
20 谈礼貌 合肥市螺岗小学 赵勋.
Xián 伯 牙 绝 弦 安徽淮南市八公山区第二小学 陈燕朵.
线性回归.
第八章 服務部門成本分攤.
第 1 章 單一預測變數線性迴歸.
3-3 随机误差的正态分布 一、 频率分布 在相同条件下对某样品中镍的质量分数(%)进行重复测定,得到90个测定值如下:
感知机与基于间隔算法 5.7.
蒙公一中韦群珍.
用加減消去法解一元二次聯立方程式 台北縣立中山國中 第二團隊.
第二节 偏 导 数 一、 偏导数概念及其计算 二 、高阶偏导数.
Presentation transcript:

第 四 章 迴歸分析應注意之事項

判定係數 R2 的問題 把 R2 =0.8 誤解為預測的準確度為 80﹪,即100 次的預測有 80 次是正確的; 事實上,R2 真正的含意是:預測變數放入模式後,應變數總變異降低的比例。 不同的領域對 R2 的大小要求不一樣: 在自然科學領域,通常要求較高的 R2; 對社會科學而言,有時 R2 ≥ 0.3就相當不錯了。

判定係數 R2 的問題 為了得到較高的 R2,有的研究者常欠缺思考便選取模式。例如並無證據證明迴歸式經過原點,但因為經過原點的迴歸式 R2 較大,便採用經過原點的模式。 為了使 R2 變大,於是在迴歸式中放入了太多不必要的預測變數。

兩變數有相關誤以為有因果關係 不知何者為因,何者為果。 可能二者並無關係,而係受第三者之影響。 因果關係,必須以相關理論為依據。

未作殘差分析 在使用迴歸分析之前,必須先檢查其基本假設是否成立;如假設條件不成立,則不能採用迴歸分析。 迴歸分析的三個假設條件: 條件常態分配 變異數同質性 殘差項獨立性

預測範圍的錯誤 由資料建立模式後,在作預測時,如果預測變數值不在原先搜集資料所屬的範圍內,則這種預測的結果就會很危險。

預測值 與 擬合值 迴歸模式建立後,如評估無誤,即可作預測。 迴歸模式建立後,將 x 代入迴歸式中,即可預測 y 的值( y = β0 + β1x )。 如(x,y)已在原始資料中,則將 x 代入迴歸模式,所得之 y 值稱為擬合值,該值會出現在迴歸線上。觀察值與擬合值的差距稱為殘差。 將一新的 x 值代入迴歸模式中,所得之 y 值稱為預測值,該值會出現在迴歸線上。 ︿ ︿ ︿ ︿ ︿

預測值 與 擬合值 身高 * * * * * * * * * * * * * * * * * * * 10 20 40 年齡

異常點與影響點的不當處理 若資料中出現異常點,可能具有其特定之含意,如一律將之刪除,可能會產生偏差的結論。 資料中若出現離群值,通常需提出解釋。

將觀察之結果視為實驗之結果 觀察的結果,其推論性較差,因為隱含的不確定因素太多; 實驗而得的結果比較能夠確定其變因,故解釋性較好。 例如:收入與受教育年限之間的關係。

整體與個別資料迴歸之不同 可能不同的組別其相關性都很低,但是將各組併在一起後,可能會變成很高的相關性。 例如:P4-5,圖4.2。

辛浦森詭論 在幾組值中都顯示出的關聯或比較,有可能在數據合併成一組時全部消失甚至倒轉方向。 男性 女性 通過 35 20 不通過 45 40 總和 80 60 通過率 35/80 = 44% 20/60 = 33%

電機工程系 男性 女性 通過 30 10 不通過 總和 60 20 通過率 30/60 = 50% 10/20 = 50%

英 文 系 男性 女性 通過 5 10 不通過 15 30 總和 20 40 通過率 5/20 = 25% 10/40 = 25%

1976至1987年間在佛羅里達的案例 試討論死刑判決是否與被告種族有關?

合計來看,似乎被告為白人時,被判死刑的機率反而較被告為黑人時被判死刑的機率還高;但將被害者的種族列入考慮時,則結果完全相反。

不論被害者為白人或黑人,我們發現黑人被判死刑 的比率都較白人高!所以我們認為死刑的判決確實較 不利於黑人。

欠缺相關知識而設出謬誤的迴歸式 例如:搜集長方形傢俱之周長與面積之關係而得出迴歸式。 迴歸式: Yi = β0 + β1Xi1 + εi 數學式: Yi = Xi1 × Xi2

觀察的迴歸線與實際迴歸線的差別 散佈圖所形成的橢圓形之長軸並不就是迴歸線,而是第一主成份線。 迴歸線的斜率比較小。

迴歸線

量測誤差之問題 量測誤差是所有量測問題上不可避免的事,任何儀器所顯示出來的數據都無法絕對精確,只是精確到小數點幾位的差別不同而已。 世界上沒有百分之百可靠的量度這回事。 就像比較大的樣本可以減少樣本統計量的變異一樣,多用幾個量度來平均,也可以減少結果的變異。

量測誤差的三個假設條件 xi 的量測誤差符合常態分配,平均數為 0,變異數為δ2。 yi 的量測誤差符合常態分配,平均數為 0,變異數為δ2 。 貝克生模式:x 值事先已設定好,但實際實驗時 x 值可能有偏差。