Random Forest (隨機森林) 學號:R 姓名:王順達

Slides:



Advertisements
Similar presentations
办公室保健指南. 减少辐射篇 ❤显示器散发出的辐射多数不是来自它的正面,而是侧面和后面。因此,不要 把自己显示器的后面对着同事的后脑或者身体的侧面。 ❤常喝绿茶。茶叶中含有的茶多酚等活性物质,有助吸收放射性物质。 ❤尽量使用液晶显示器。
Advertisements

教育部 1 教育部技職司 南區: 2010 年 11 月 5 日 北區: 2010 年 11 月 8 日 中區: 2010 年 11 月 9 日 產學攜手合作計畫 政策宣導.
index 目次 ( 請按一下滑鼠,解答就會出現喔 !) 接續下頁解答 3-1 極限的概念.
104 年度環保小學堂 經費編列注意事項 會計室 : 丁子芸 中華民國 103 年 10 月 22 日 會計室 : 丁子芸 中華民國 103 年 10 月 22 日.
魏 饴. 处级干部培训班讲座 一、卓越干部的德行素质  常修为政之德、常思贪欲之害、常怀律己之心!  孔老夫子有个观点 “ 为政以德,譬如北辰居其所而众星拱之。 ”  司马光《资治通鉴》 “ 才者,德之资也;德者,才之帅也。 ” “ 德 ” 胜 “ 才 ” 谓之 “ 君子 ” , “ 才 ”
手动换页 域外风情系列 儿子去美国留学,毕业后定居美国。还给我找了 个洋媳妇苏珊。如今,小孙子托比已经 3 岁了。 今年夏天,儿子为我申请了探亲签证。在美国待 了三个月,洋媳妇苏珊教育孩子的方法,令我这 个中国婆婆大开眼界。
布袋戲曲的賞析. 什麼是戲曲? 布袋戲是 戲曲嗎? 泉州木偶戲欣賞: 564 布袋戲初傳台灣時,受南管影響。 在台灣深根發展後,轉受北管影響深遠。 進入電視布袋戲後,與南北管脫勾, 黃俊雄領導的金光布袋戲引入台語流行歌,
一、真愛密碼 二、尋求真愛 三、有自尊的愛. 。如果雙方對愛情產生 質疑、困惑時,則表示 彼此之間的愛情關係仍 有 待加強或釐清,千萬別 急著為自己的人生大事 下決定。 我是一個 16 歲的未婚媽媽,發現自 己懷孕時,已經五個月大了,我知 道自己沒能力照顧孩子,在驚訝之 於,大人們只好坦然接受,幫我找.
大地遊戲王 課程實錄.
99學年度第1學期導師輔導工作座談會 全校性共同必修服務學習課程 報告單位:學務處領導知能與服務學習中心.
从生命伦理学角度 对转基因食品市场准入标准及道德评价标准的研究
加強水銀體溫計稽查管制及回收 回收作業須知及緊急應變措施
第一章 会计信息系统 第一节 计算机会计概述.
第4章 分錄及日記簿 4-1 借貸法則 4-2 日記簿的格式及記錄方法 4-3 分錄的意義及記錄方法 4-4 常見分錄題型分析
3D五子棋 學生:何承祐 學號:
老子的素朴 厦门大学计算机科学系 庄朝晖.
大规模机器学习算法GBDT及应用 王志伟(冰逸)
Some Knowledge of Machine Learning(1)
分類:基本概念、決策樹與模型評估.
我在哈佛、麥肯錫 學到的一流工作術 富坂美織◎著.
組別: 指導老師:張景榮 老師 組員: 李儀姿 、 陳雅貞
经济成长和差距平等化 东京学艺大学 铃木亘.
第十三屆 Step.1 我們的目標 Step.2 我們的角色 Step.4 權利與義務 義務 權利 年繳會費五百元整
企業政策 組員: 柯凱旗 楊惠雅 徐婷姿 劉家伶 王玟雅.
第十章 中国旅游地理 甘肃联合大学旅游学院.
主讲人:王燕超 时间:2013年12月11日 地点:310 (报告厅)
系統分析與設計 系級:資管三B 姓名:朱秋儒 學號:
财务管理.
個人投資理財分析 財務狀況匯總表 銀行存款 共同基金 外幣基金 股票投資 保險價值 黃金投資 支出預算 房貸計算 不動產價值 資源變化資料庫
对实验教学工作的认识与思考 西北工业大学 万小朋 2014年11月.
植物保护 课程整体设计 汇报 申报省级精品资源共享课建设 植物保护课程组.
一言之辩强于九鼎之宝 三寸之舌胜于百万雄师
政府扶持资金通览 技术改造篇.
兒少性侵害預防與保護 之約會強暴篇.
Semantic-Synaptic Web Mining: A Novel Model for Improving the Web Mining 報告者:陳宜樺 報告日期:2015/9/25.
本科生医保资料的提交.
文本分类综述 王 斌 中国科学院计算技术研究所 2002年12月.
編碼 用於資料傳輸及壓縮 漢明碼 霍夫曼編碼.
Supplement Data Mining 工具介紹 楊立偉教授 台灣大學工管系 2014 Fall 1.
Supplement Data Mining 工具介紹 楊立偉教授 台灣大學工管系 2015 Fall 1.
統計圖表的製作.
CH03 資訊管理的智慧觀點:技術篇.
A Study on the Next Generation Automatic Speech Recognition -- Phase 2
决策树算法及应用拓展 内容简介: 概述 预备知识 捕捉变化数据的挖掘方法 小结 决策树生成(Building Decision Tree)
《结构力学认知实验》(授课形式)的上课时间改为: 5月5日(周二)晚上18:00~19:30和19:30~21:00,
《结构力学认知实验》(授课形式)的上课时间改为: 5月7日(周四)晚上18:30~20:00和20:00~21:30,
期末報告-- [ridge regression]
Reference to FUNDAMENTALS OF DATA STRUCTURE IN C++
Course 4 分類與預測 Classification and Prediction
HITSCIR-TM zkli-李泽魁 March. 24, 2015
選擇勞退新制,終身免煩惱 勞工退休金新制 說明會.
第十章 線上行銷研究.
主講人:陳鴻文 副教授 銘傳大學資訊傳播工程系所 日期:3/13/2010
第 10 章 專家系統與智慧型資料庫 2019/4/26.
兒少保護通報處理流程介紹 臺中市家庭暴力及性侵害防治中心 陳秀婷/張美慧 社工督導員 2012/10/19.
畢業資格審查系統 操作步驟說明.
新制退休實務計算說明- 現職人員退休範例說明
中国农业科学院博士后学术论坛 博士后基金申请的经验及体会 中国农业科学院生物技术研究所 秦 华 博士
設計者:台中市重慶國小 張祐榕.楊晟汶.張儷齡
基于最大margin的决策树归纳 李 宁.
SLIQ:一种快速可伸缩分类器 Manish Mehta, Rakesh Agrawal, Jorma Rissanen IBM Almaden Research Center, 1996 报告人:郭新涛
期末報告 Isolation Forest 學號:R 姓名:林韋宏
106 學年度新生入學說明會 國立臺灣海洋大學 教務處簡介
學士學位畢業論文說明 逢 學 大 甲 土 理 管 地 2009/10/05.
高雄市97年度國民小學閱讀計畫創新教學-教案達人創新教學方案
Speaker : YI-CHENG HUNG
績優教師分享 美容保健科 林品瑄 教師.
新選課系統說明會 電算中心 林以仁.
微 處 理 機 專 題 – 8051 C語言程式設計 主題:階乘計算
分類樹(Classification Tree)探討Baseball Data
Presentation transcript:

Random Forest (隨機森林) 學號:R05546035 姓名:王順達 (4)http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html

~Outline~ 演算法介紹 決策樹 隨機森林 程式碼 Demo!!! 結論 參考資料

隨機森林的前身~決策樹演算法 (Decision Tree) 決策樹演算法:思維最直觀,最簡單的演算法 監督式模型 用於classification及regression 概念:決策樹中每個節點表示一次的分類,而每個分叉路徑則代表某個可能的屬性值(feature類別) 節點有三種: 根節點:只有輸出的邊 內部節點:有輸出也有輸入的邊 葉節點/終端節點:只有輸入的邊

隨機森林的前身~決策樹演算法 喜歡看球賽? Yes No 喜歡看帥哥? 喜歡看帥哥?

隨機森林的前身~決策樹演算法 決策樹如何決定節點順序? Splitting Rule: Information Gain(資訊增益):entropy(亂度)越低的越接近根節點 Entropy = -p * log2 p – q * log2q p:true的比例 q:false的比例 Gini Index : 基尼係數越大的越接近根節點 基尼係數越大,表示越不平均。 Gini Index =p^2+q^2 最常見的splitting rule

缺點:很容易overfitting! 隨機森林的前身~決策樹演算法 優點:訓練速度極快(遠優於其他演算法) 如果沒有對決策樹的成長作限制,決策樹會為每個feature創建節點,使得所有資料得到100%正確的分類

解決方法之一:一棵樹不好,那就用多幾棵吧! Step 1:行採樣 Decision Tree Random Forest

解決方法之一:一棵樹不好,那就用多幾棵吧! Step 2:列採樣(挑選feature) Decision Tree Random Forest c c c d d b d b e a e a e a

解決方法之一:一棵樹不好,那就用多幾棵吧! Step 3:投票 Decision Tree Random Forest c c c d d b d b a e a e a e pineapple apple apple pineapple pineapple

隨機森林演算法 監督式模型 集成學習方法(ensemble method) 用於classification及regression 隨機森林的優點: 訓練速度快 基本由決策樹延伸 在训练完后,它能够给出哪些feature比较重要 採樣過程保證了隨機性,大大降低overfitting 的風險

程式碼

程式碼(max_feature 問題)(1/3)

程式碼(max_feature 問題)(2/3)

程式碼(max_feature 問題)(3/3)

Let’s Demo!!!

結論 通過實做,對於data mining的步驟有深刻的認識 利用scikit可以更方便地實現data mining 初次接觸python coding 對於Window 和python的鬧不和感到很生氣。。。

參考資料 決策樹 Decision trees https://chtseng.wordpress.com/2017/02/10/%E6%B1%BA%E7%AD%96%E6%A8%B9-decision-trees/ 信息增益到底怎么理解呢? https://www.zhihu.com/question/22104055 隨機森林(Random Forest)詳解(轉) https://tw.saowen.com/a/ebd618be5c9028168349494ceeb49ba87e9b3a6d114816697ec0cbcc6cf99ff5 转:机器学习中的算法(1)-决策树模型组合之随机森林与GBDT http://blog.csdn.net/bhj5787/article/details/11480911 機器學習算法之隨機森林(Random Forest) https://kknews.cc/zh-tw/news/brzmvj.html 隨機森林Random Forest https://chtseng.wordpress.com/2017/02/24/%E9%9A%A8%E6%A9%9F%E6%A3%AE%E6%9E%97random- forest/ sklearn.ensemble.RandomForestClassifier http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html