Regression Of Baseball Data

Slides:



Advertisements
Similar presentations
课前寄语 1 、保持纪律 2 、相互配合. 第三节 公民的投资 —— 公民的存款储蓄 课堂导入.
Advertisements

酒店绩效考核攻略 一 业务流程再造 管理环节突破 利润急速倍增 专为您企业量身裁衣服务 突破导师 : 周忠亭副教授 北京大学管理案例研究 中心特聘餐饮讲师 北洋战略研究院研究员 北大时代光华高级讲师 中国十大餐饮管理讲师 中华酒店管理专家教授 教育部首批中国餐饮经理人 师资成员.
办公室保健指南. 减少辐射篇 ❤显示器散发出的辐射多数不是来自它的正面,而是侧面和后面。因此,不要 把自己显示器的后面对着同事的后脑或者身体的侧面。 ❤常喝绿茶。茶叶中含有的茶多酚等活性物质,有助吸收放射性物质。 ❤尽量使用液晶显示器。
人力资源工作总结 行政部 人力资源部年度工作 一方面通过招聘管理、劳动合同管理、 入离职管理等,确保各项人事管理工作 的合法性、规范性. 另一方面通过建立员工培训计划,加强 企业文化的贯彻和渗透,提升员工的凝 聚力和归属感,提升员工的敬业度。
旅遊實務Ⅰ 授課教師:李健民 上課班級: 320. 課程大綱 旅遊業之設立程序 旅行業組織結構 旅行業之分類 旅行業之管理.
配樂:夢的序曲 ( 鋼琴 ) 雁蕩山因山頂有湖,蘆葦茂密,結草為湯,南歸秋雁多宿於此,故名雁蕩。始於 南北朝,興於唐,盛於宋,雁蕩山來晚了一步,未能在 “ 五岳 ” 中占得一席之地。 沒有金碧輝煌的涂飾,村野之山的雁蕩倒因此多了份瀟灑風神。
創新快速化妝法 組員:施伊倩 4A1F0904 劉欣怡 4A1C0060 賴永哲 4A1F0901 陳佩君 4A1F0907.
親 ( 四 ) 親近神的路. 一、親的三字訣、七字訣: 親近神,親愛人; 與主交通親近神,同情關心親愛人。 甚麼是親? 1. 親有親近、親愛,更有關心、同情、親切的 意思。 2. 親的人與人沒有間隔,拉近人與人之間的距 離,並且樂意幫助人,與人相調建造在一起。
魏 饴. 处级干部培训班讲座 一、卓越干部的德行素质  常修为政之德、常思贪欲之害、常怀律己之心!  孔老夫子有个观点 “ 为政以德,譬如北辰居其所而众星拱之。 ”  司马光《资治通鉴》 “ 才者,德之资也;德者,才之帅也。 ” “ 德 ” 胜 “ 才 ” 谓之 “ 君子 ” , “ 才 ”
1. 法律學系助教群: 大學部助教 徐碧霜 行政助教 葉靜芳 研究所助教 阮博謙 台中 法政學院 1. 台北 法商學院 民國 50 年 中興大學合併法商學院法律系 民國 89 年 法商學院改制為台北大學.
第二班群教師團隊 105 張心平 107 鐘于寧 106 黃意評 108 鄭婉茹. 第二班群之班親會說明 學校規定事項說明 教學活動說明 班群活動介紹.
一、真愛密碼 二、尋求真愛 三、有自尊的愛. 。如果雙方對愛情產生 質疑、困惑時,則表示 彼此之間的愛情關係仍 有 待加強或釐清,千萬別 急著為自己的人生大事 下決定。 我是一個 16 歲的未婚媽媽,發現自 己懷孕時,已經五個月大了,我知 道自己沒能力照顧孩子,在驚訝之 於,大人們只好坦然接受,幫我找.
大地遊戲王 課程實錄.
差勤.
申論題要拿高分並不容易,因為他是 有一定的技巧的,如果你遵照下列技 巧來作答申論題,相信高分並不難拿, 其技巧如下:
第一节 职业基础知识 第二节 社会需要剖析 第三节 用人单位认知
102大學甄選入學 個人申請、繁星推薦說明 主講人:簡慧嫻.
餐旅會計學 Ch2 借貸法則.
新進教師研習 教務處報告 報告人:教務處 林永仁 2011 年 8 月31日.
「明清時期台灣古典散文」 教師:田啟文.
加強水銀體溫計稽查管制及回收 回收作業須知及緊急應變措施
第三組做的報告 . 組長:紀美朱 組員:謝寶岳 羅芳婷 李依芳 李銘賢 還有內容.
新頒解釋函令 ● 所得稅扣(免)繳相關法令、 ● 所得稅扣(免)繳申報實務 ● 扣繳常見稅務違章類型 財政部南區國稅局屏東分局
第4章 分錄及日記簿 4-1 借貸法則 4-2 日記簿的格式及記錄方法 4-3 分錄的意義及記錄方法 4-4 常見分錄題型分析
鼻炎 症狀: 鼻(眼睛)內發癢或不舒服、 打噴嚏、 流鼻涕(水)、 鼻塞………等 。 鼻子內的任何發炎。
《疯 娘》 --100个人看后99个人会落泪的故事 图文:网络
课题摘要: 位育学子每天三点一线:教室,寝室,及其食堂。俗话说:“民以食为天。”我们一直想借一个契机去调查一下食堂到底有什么菜,什么菜最合胃口,如何在节约时间的同时又能享用美味的饭菜等等。借这个课题,我们深入研究了位育食堂的种种特色与“攻略”,现在就为大家奉上我们最真诚的建议。 课题来源: 在未踏进位育之前,对“吃在位育”这句话早有耳闻。等到有幸踏进校园,才知此话确实不假。每天行色匆匆地穿梭于校园之间,面对繁杂的课业,一顿可口的经过精心搭配饭菜可以让你横扫饥饿,补充能量,从而更好地进行之后的学习。为了避免
苟利国家生死以, 岂因祸福避趋之。 ----禁毒英雄,一生为公 --林则徐.
2015届就业指导课程教学大纲介绍.
小论文的选题技巧与写作要领.
模块七 房地产营销渠道策略 主要内容 房地产营销渠道类型 房地产营销渠道选择方法 开发商与代理商的合作模式.
第十三屆 Step.1 我們的目標 Step.2 我們的角色 Step.4 權利與義務 義務 權利 年繳會費五百元整
單元名稱: 愛的十字路口.
遣詞造句知多少? 中文系 王偉勇教授 兼通識教育中心中心主任.
主辦單位:勞動部勞動力發展署 承辦單位:財團法人中華民國職業訓練 研究發展中心
錯 視.
(4)理论体系与实训模块 必须衔接、融合 本课程把理论教学体系与实训模块结构连接成一个完整的高职课程体系。
最有利標及評選優勝廠商 講師 劉金龍 經歷:臺中市政府發包科科長.
三、市场营销学研究的基本方法 (1)产品研究法。是以物为中心的研究方法,即在产品分类的基础上,对各类产品市场分别进行研究。 (2)机构研究法。是以研究市场营销制度为出发点,体现以人为中心的研究方法,即集中对整个市场营销系统中的各特定机构的性质和功能进行研究。 (3)职能研究法。是以研究产品从生产者到消费者手中所进行的各种营销活动过程中,市场营销组织所发挥的功能的方法。
财务管理.
綜合所得稅基本介紹 財政部南區國稅局新化稽徵所 簡秀珍.
交通事故處置 當事人責任與損害賠償 屏東縣政府警察局交通隊.
青春期 要長大囉! 男女有別 生命的誕生~兩性結合才有下一代的新生命 為什麼會有月經? 經痛怎麼辦 ? 渡過快樂青春喜歡自己
新竹縣政府警察局新埔分局偵查隊 姚乃文 何怡慧 富光國中
大学生就业指导 第二讲 求职信息收集和自荐材料的准备.
植物保护 课程整体设计 汇报 申报省级精品资源共享课建设 植物保护课程组.
親愛的吉姆舅舅:   今天吃完晚餐後,奶奶說,在家裡情況變好以前,您要我搬到城裡跟您住。奶奶有沒有跟您說,爸爸已經好久沒有工作,也好久沒有人請媽媽做衣服了?   我們聽完都哭了,連爸爸也哭了,但是媽媽說了一個故事讓我們又笑了。她說:您們小的時候,她曾經被您追得爬到樹上去,真的嗎?   雖然我個子小,但是我很強壯,只要我會做的我都可以幫忙,但是,奶奶說,做其他事情以前,要先把功課做完。
网络的利与弊 2017/3/19 该课件由【语文公社】
2012年度人力资源部工作总结
最有利標及評選優勝廠商 講師 劉金龍 經歷:臺中市政府發包科科長.
辦理建教合作注意事項 國立台灣師範大學 鄭慶民
政府扶持资金通览 技术改造篇.
执行《劳动合同法》中 应当注意的十大问题.
物 资 供 应 简 报 第三期 2014年3月 中铁二局物资重庆分公司项目物资简报.
在国家逐步完善劳动用工法规背景下 企业的用工策略探讨
Ch3 指數與對數 3-5 指數與對數的應用 影音錄製:陳清海老師 資料提供:龍騰文化事業股份有限公司.
學校教職員退休條例修正草案重點報告 報告人:徐創晃.
本科生医保资料的提交.
統計圖表的製作.
《结构力学认知实验》(授课形式)的上课时间改为: 5月5日(周二)晚上18:00~19:30和19:30~21:00,
《结构力学认知实验》(授课形式)的上课时间改为: 5月7日(周四)晚上18:30~20:00和20:00~21:30,
CH2 家庭經濟與消費 貳、家庭經濟之管理.
畢業資格審查系統 操作步驟說明.
新制退休實務計算說明- 現職人員退休範例說明
通識課程 職場危害與管理 組員:吳敬揚 黃于真 黃家賢 張龍溪.
106 學年度新生入學說明會 國立臺灣海洋大學 教務處簡介
學士學位畢業論文說明 逢 學 大 甲 土 理 管 地 2009/10/05.
高雄市97年度國民小學閱讀計畫創新教學-教案達人創新教學方案
參考資料來源:教育部全球資訊網 簡報製作:林秀玲.
分類樹(Classification Tree)探討Baseball Data
Presentation transcript:

Regression Of Baseball Data 目標: 把baseball data中的各個變數, 用迴歸的方法,找出最佳的線性迴歸模式,分析選出的變數對薪水(SALARY)的影響,並且根據第一組的建議將薪水做轉換、創新變數來增加迴歸模型的解釋度。

Regression Of Baseball Data 原始資料的分析 變數變換後,再分析轉換後的迴歸模式 加入新的變數,再做分析 預測所缺失的薪水資料

原始資料的分析 變數名稱解釋: Response Varibale: SALARY87年球員的薪水 Predictor Varibale: AB上場打擊次數 C.AB生涯上場打擊次數 HIT安打數 C.H生涯安打數 HR全壘打數 C.HR生涯全壘打數 R回本壘得分數 C.R生涯回本壘得分數 RBI打點 C.RBI生涯打點 W保送 C.W生涯保送 YEAR資歷 PO使對手出局數 ASS助殺 (P.S這裡的「生涯」是指 ER失誤 球員在大聯盟的資歷)

原始資料的分析 The Result Of STEP: 最初先不做任何的變數變換,使用R內「step」指令,去選取原始資料中較有影響力的變數。最後所出選取較有影響的變數順序為「生涯打點」、「安打數」、「使對手出局數」、「上場打擊次數」、「保送」等五個變數(C.RBI,HIT,PO,AB,W)。接下來就對這六個變數來做迴歸分析,看看這些變數如何來解釋87年球員的薪水(SALARY)。

原始資料的分析 Regression Model: Result: SALARY=-80.27+0.68*C.RBI+8.41*HIT+0.22*PO-1.86*AB+4.14*W Result:

原始資料的分析 Analysis: 由上一頁雖可看出,各解釋變數之係數是顯著的。其中最值得去注意的是,薪水大都會隨著解釋變數的增加而增加,除了當上場打擊次數(AB)增加,薪水反而會減少。這是蠻有意思的地方。有可能是因為:雖然他上場打擊次數很多,但有可能其表現並不佳,所以反而導致薪水隨著上場打擊次數增加而減少。 由其迴歸模式可看出,「安打數」與「保送」這兩 個變數,對於薪水的影響比其它變數大上許多。以 正常情況論,安打數多,其薪水也會比較高,是合 理的。

原始資料的分析 接下來要討論為何「保送」會影響薪水:有可能是因為選手表現好(其薪水高是合理的),所以對手寧願直接保送,也不給其打擊的機會。因此這有可能是為何「保送」會影響薪水的原因。 但由這些解釋變數去解釋87年棒球選手的薪水,解釋能力卻只有59%,解釋度並不高。因此我們希望能再造出另一新的Model,其用來解釋薪水的變數,能有不錯的解釋能力,且個各變數都是有其意義。

變數轉換後Model之分析 IDEA: 在此新的Model內的變數,已做變數變換了。如:87年球員的薪水,已做log轉換。除此之外,生涯的打擊次數、安打、全壘打等生涯變數,都已除上各球員在大聯盟所待的資歷。以這些新的變數,重覆之前的步驟,再重新去分析,以期望能有更不錯的結果。

變數轉換後Model之分析 變數變換:因為第一組的建議,因此我們將SALARY做log轉 換 換,並創以下幾個新變數。 Response Varibale: SALARYlogsal (取 log) Predictor Varibale: C.ABAB1 (平均一年上場打擊次數) C.HHIT1 (平均一年安打數) C.HRHR1 (平均一年全壘打數) C.RR1 (平均一年回本壘得分數) C.RBIRBI1 (平均一年打點數) C.WW1 (平均一年保送數) (以上是將所有跟生涯有關的解釋變數,皆除以其各別的 資歷,得到新的變數)

變數轉換後Model之分析 The Result Of STEP: 使用R內的「step」指令,去選取出更適合的變數。最後所選出較有影響的變數為「平均一年安打數」、「資歷」、「安打數」、「保送」、「上場打擊次數」、「使對手出局數」(HIT1,YEAR,HIT,W,AB,PO)等六個變數。皆下來以這六個變數來做迴歸分析,探討對薪水的解釋度為何。

變數轉換後Model之分析 Regression Model: Logsal=4.07+0.0062*HIT1+0.084*YEAR+0.011*HIT+ 0.007*W-0.0021*AB+0.00021*PO Result:

變數轉換後Model之分析 Analysis: 由上一頁的迴歸分析結果可看出,大部分解釋變數的系數是顯著的,除了PO這變數的系數不顯著外。且AB的係數是以負數呈現,結果與第一次迴歸結果相似。但變數解釋度提高至64%,所以可知生涯變數除以資歷後,是合理的。

變數轉換後Model之分析 由上一頁的迴歸模式可看出,變數「資歷」對薪水的影響力,比其它變數大。所以資歷高,薪水就會多,是合理的。另外,在眾多除以「資歷」的生涯變數中,為何只選擇「平均一年安打數」,且「安打數」也被選入,這有可能是指此兩變數彼此間不能互相取代、或解釋。 「平均一年安打數」有點像是球員本身的價值,說明球員生涯平均的表現,可見「安打數」對薪水來說,可能是一個重要的指標!

加入新變數後的Model之分析 創新的變數: 在此創一新變數,「上壘率」(b),其數學算式為(安打數+保送)/上場打擊次數。之所以會創「上壘率」是因為:如果壘上有人,則對球隊進攻方面是有利的。所以直覺上會覺得此變數應會與薪水有關,故創此變數。

加入新變數後的Model之分析 The Result Of STEP: R內「Step」指令選出「平均一年安打數」、「資歷」、「安打數」、「保送」、「上場打擊次數」、「使對手出局數」等六個變數,再加上「上壘率」,共七個變數,其對薪水是有影響的。接下來就對這七個變數做迴歸分析。

加入新變數後的Model之分析 Regression Model: Result: Logsal=5.394+0.0062*HIT1 + 0.0845*YEAR + 0.0188*HIT +0.0154* W-0.005AB-3.668b+0.00019PO) Result:

加入新變數後的Model之分析 Analysis:

加入新變數後的Model之分析 創新的變數: 除了之前所創的上壘率,之後再創另一變數,其為資歷的平方,之所以會創此變數,加上第一組的建議,且在每一次「step」在選取較有影響力的變數時,都會考慮「year」此變數,由此可知,這變數對薪水有很強的影響力。 但觀察「year」vs.「logsal」的分布圖,發現其圖形有二次曲線的趨勢,所以才會加入此變數,來分擔解釋薪水的部分。資歷2: year2=YEAR*YEAR 分布圖

加入新變數後的Model之分析 The Result Of STEP: 接續上一模式的變數,再加上所創的新變數,「平均一年安打數」、「資歷」、「安打數」、「保送」、「上場打擊次數」、「使對手出局數」、「上壘率」、「資歷2」等共八個變數。再以「step」去幫我們選取出有效的變數為「平均一年安打數」、「資歷」、 「保送」 、「使對手出局數」、 「資歷2」。接下來對這五個變數做迴歸分析。

加入新變數後的Model之分析 Regression Model: Result: Logsal=3.206+0.01015*HIT1 +0.3623*YEAR+0.006119* W +0.0002905*PO-0.01551*year2 Result:

加入新變數後的Model之分析 Analysis: 由上一式的迴歸式中,可看出每個變數都是顯著重要的。但「資歷2」的係數卻為負的,這或許是因為「資歷」在解釋薪水時,解釋過多,而為了調整過多的解釋,「資歷2」的係數才會為負的。且在此模式內,「保送」的影響力變多,反而「安打數」在此並沒有被選入模式,這或許是因為「保送」取代解釋「安打數」,所以「保送」的影響才增加這麼多。 另外迴歸模式解釋度增加至82%。

預測 由之前的迴歸分析結果,可知目前最好迴歸模式為Logsal=3.206+0.01015*HIT1+0.3623*YEAR+0.006119* W+0.0002905*PO-0.01551*year2 其解釋度為82%。故以此模式來預測這些薪水有缺失的資料。 預測資料

預測完的總結 什麼樣的人薪水較多 在使用所做出最好模式去預測缺失的薪水。 我們先從球員在大聯盟所處的資歷來看其薪水的高低。 從其分布圖可看出,大約以11年為一分界點,11年之前薪水有逐年增加的趨勢,而11年以後則略有逐年下降的情形。雖然薪水與資歷相關性高,但年紀越大體力也會下降,所以薪水會隨著下降這是合理的。 薪水分布圖

總結 在迴歸分析這一部份,接觸了真實的案例,我們嘗試以不同的變數來分析解釋87年的薪水。因而創造出許多不同的迴歸式,也學習如何去解釋我們做出的結果。從中學習許多。也發現其實有很多事並沒有一定的解答,全看所分析的結果為何,並做有依據的分析。

分布圖 回上一頁

預測薪水分布圖 回上一頁