永續運輸資訊系統 -交通事故資料分析研究 周家慶 高級分析師 交通部運輸研究所.

Slides:



Advertisements
Similar presentations
学生、幼儿意外伤害保险  被保险人 在深圳市取得合法办学资格的全日制大中小学校、中等职业学校 (包括普通中专、成人中专、职业高中和技工学校)、特殊教育 学校、幼儿园在籍(园)学生。
Advertisements

平衡飲食保健強身 整理至簡體版,作者不可考。內容為 參加國際健康會議所發表的心得。. 人應該活多久 有人告訴我五六十歲就差不多了。 我在醫院工作四十年了,絕大部分病死的人是 很痛苦的。 我在美國遇見張學良,一進門見到他就大吃ㄧ驚, 他眼不花,耳不聾,很多人問他:少帥,您怎 麼能活這麼久? 他回答:不是我活的久,是他們活的太短了。
偵辦侵害營業秘密犯罪之執行情形 法務部調查局. 一、前言 ( 一 )102 年 1 月 30 日公告施行營業秘密法 ( 一 )102 年 1 月 30 日公告施行營業秘密法 修正案,增加侵害營業秘密之刑事 修正案,增加侵害營業秘密之刑事 責任,對於意圖在境外使用而竊取 責任,對於意圖在境外使用而竊取.
腫瘤個案管理師之職責與作業 乳癌個案管理師 : 陳慧蘭. 腫瘤個案管理師之職責  收案  評估病家需求  擬訂及提供照護計畫  參與多專科共同照護  提供追蹤管理  品質監測及回饋.
1 計量技術人員考訓制度. 2 簡 報 大 綱 計量考訓制度簡介 應考須知說明 考試範圍內容、題型及配分權重.
徐州工业职业技术学院. 人才市场需求 2013 年我国安全类专业统计表 学历层次专业名称专业代码毕业生数招生数在校生数开设学校数 本科 安全工程 专科 安全技术管理 中专 0000.
天文信息学的思考 国家天文台 赵永恒 2011 年 11 月. 2 X-informatics 生物信息学 化学信息学 医学信息学 水信息学 地理信息学(系统) 空间信息科学与技术.
创意鄱阳湖— 一种基于无形资源理念开发鄱阳湖的思考 以传奇背景音乐作为开场,体现创意创造传奇 南昌大学 黄细嘉
联合国提出个口号:“千万不要死于无知” 保健的三个里程碑 平衡饮食 有氧运动 心理状态.
防盜裝置  學生科技探究.
MRP到ERPII之演進 1970年代 1980年代 1990年代 2000年代 企業應用軟體 MRP MRPII ERP EERP
饮食中的平衡 酸 性 食 物 与 碱 性 食 物.
平衡飲食保健強身.
上海九晶电子材料股份有限公司 招聘简章.
系統分析與設計 第九章 資料設計.
Presentation of Big Data Issues
政府採購錯誤行為態樣 報告人:張錦川 日 期:96年7月.
古文選讀.
第五章 資訊科技基礎建設與新興科技.
C语言程序设计 李伟光.
現代中國 議題: 「一帶一路」.
农信社信贷产品实务技能提升培训.
2009年周口市公共机构高效照明产品推介会
教學經驗分享 吳毅成 國立交通大學資訊工程系 2012年4月.
数据分析及研究方法 ——以如何从事宏观经济课题研究为例
高齡者道路交通事故特性與道安防制措施 研究計畫報告
一、平面点集 定义: x、y ---自变量,u ---因变量. 点集 E ---定义域, --- 值域.
採購法規概要 報告人:臺北市政府法規委員會 編審 陳世超 土木技師高考及格 結構技師高考及格 公務人員高考及格 國立中興大學土木工程碩士
運輸安全白皮書(Ⅲ) 軌道安全篇 主辦單位:運輸安全組.
第六章 資料倉儲與採礦技術 6.1 資料倉儲與採礦定義 6.2 資料採礦之步驟與技術分類 6.3 資料採礦在顧客關係管理之應用
  中国技术交易信息服务平台 中国技术市场管理促进中心.
微博红人:留几手.
招投标知识培训 培训人: 日期:2011年04月08日 西安翼舞时风数码科技有限公司.
採購法規概要 報告人:臺北市政府法規委員會 編審 陳世超 土木技師高考及格 結構技師高考及格 公務人員高考及格 國立中興大學土木工程碩士
植物辨識及分類 呂春森 基隆市立暖暖高級中學 植物辨識及分類 呂春森 基隆市立暖暖高級中學.
『兩岸四地- 校園節能文化推廣』 座談會 2008年1月26日 澳門大學 校園管理總監 宋傑堯.
中国教科文卫体工会全国委员会 陈志标 (2012年5月9日,中山大学)
管理学基本知识.
第三课 闲话“家”常 1.
滁州学院首届微课程教学设计竞赛 课程名称:高等数学 主讲人:胡贝贝 数学与金融学院.
“华东师大数学系部分老同事活动”(辛卯聚会)记事
第五节 读图表述.
財團法人中華民國證券櫃檯買賣中心 交 易 部 中華民國101年8月
东宝大厦简介及服务特色.
滨海学坛 周刊 总第13期 2012年10月22日 本期编辑:李秀青 温州滨海学校教科室主办.
质量管理 刘春霞
拾貳、 教育行政 一、教育行政的意義 教育行政,可視為國家對教育事務的管理 ,以增進教育效果。 教育行政,乃是一利用有限資源在教育參
科學科 污染 空氣 成因 的 : 題目 及 減少空氣污染的方法 陳玉玲 (4) 姓名 : 去到目錄.
課程銜接 九年一貫暫行綱要( )  九年一貫課程綱要( ) 國立台南大學數學教育系 謝 堅.
正、反比例意义的巩固练习.
2.4 二元一次方程组的应用(1).
國內發展PACS之回顧與展望 黃興進 彭振興 連俊瑋 國立中正大學資訊管理學系 國立中正大學醫療資訊管理研究中心
Some Effective Techniques for Naive Bayes Text Classification
財物及勞務採購作業程序及注意事項 報告人 劉麗琴
第五章 信息与系统集成技术 概述 数据流集成技术 信息流集成技术 信息管理集成技术 流程重组与业务流程集成 企业门户集成 企业集成架构
運籌管理 Chapter 12 資訊科技與運籌管理電子化 祝天雄 博士 99年12月 日.
資料探勘-案例期末報告 SQL Server 2008 Analysis Service
物联网数据处理 第一讲 数据处理基本概念 刘进军 QQ:
常見的巨量資料分析與應用 楊立偉教授 台大工管系暨商研所 2018.
SOA模型设计 杨子 2009/09/30.
第十章 線上行銷研究.
R與資料探勘(data mining)簡介
第十二章 顧客關係管理.
中国农业科学院博士后学术论坛 博士后基金申请的经验及体会 中国农业科学院生物技术研究所 秦 华 博士
An Quick Introduction to R and its Application for Bioinformatics
方案假設 因果連結 (如果…就會…) 將問題情況轉變為所需服務 確保方案的合理性 利於方案評估 例:青少年墮胎
方格紙上畫正方形.
台灣房價指數 台灣房屋 中央大學 2011年7月29日.
用加減消去法解一元二次聯立方程式 台北縣立中山國中 第二團隊.
Presentation transcript:

永續運輸資訊系統 -交通事故資料分析研究 周家慶 高級分析師 交通部運輸研究所

簡報內容 背景 交通事故資料庫與地理資訊系統 資料採礦(Data Mining) Oracle 之資料採礦模組 試作過程 結論與建議 Oracle Data Mining (ODM) 試作過程 結論與建議

背景 運輸研究所進行 「交通事故資料庫系統」研究及其分析與設計 評估交通事故分析所需之資料庫來源探討,包括死因資料庫、健保資料庫、保險資料庫、事故資料庫等。 「交通事故地理資訊系統資料庫建置」 進行國省道與臺北市事故資料之實作。 本研究重點在探討各種資料庫之龐大資料量狀況下,如何利用資料採礦架構進行事故資料分析工作。 本架構將為永續運輸資訊系統中之基本資料庫,而永續運輸資訊系統之發展目的乃是希望成為政府從事交通施政成效評估、區域交通建設發展比較與交通成長變化追蹤分析等重要工作之重要工具。

交通事故分析相關資料庫1/3 死因檔 死因資料係記錄我國國民死亡之有關資料,每位當年死亡者的資訊均以一筆記錄儲存於死因檔中,而依據國際疾病傷害與死因分類標準,與道路交通事故直接相關的死因分類為ICD 碼E810至E819之運輸事故。 事故檔 道路交通事故料係A1、A2及A3類道路交通事故案件內容,每一事故案件所記錄之資料可分成事故地點、事件本身、涉案當事人三部份,此三部份之資料分別儲存三個資料表格,彼此間以發生時間-年+序號為串連之鍵,來連結同屬一件事故的人、事、地資料。

交通事故分析相關資料庫2/3 汽車保險資料檔 門診檔與住院檔 資料檔包括一般車險及強制汽車責任險兩部份,保險從業人員處理保險事件時,其係依據投保、理賠等處理階段與保險種類之不同,而填具不同的書面資料,包括:一般車險與強制汽車責任險個別之保單資料、批單資料、理賠申請書、理賠計算書、求償計算書,此些資料在資料記錄方式、資料庫結構設計方式上彼此相連結。 門診檔與住院檔 健保資料庫記錄民眾以健康保險方式就醫之各種資料,所用之資料檔為門診處方及治療明細資料檔以及住院醫療費用清單資料檔。

交通事故分析相關資料庫3/3

交通事故地理資訊系統1/3 都市地區事故資料之空間定位 市區交通事故,以地址或交叉路口進行發生地點的描述。 以完整且正確的門牌地址資料庫進,提高事故地點的定位精度,台北市門牌地址的地理資訊資料庫。 交叉路口型事故資料則透過交叉道路之路名與電子地圖之道路名稱比對取得其路口X/Y坐標值,同時亦針對事故位置資料中之地標/地物與電子地圖之地標/地物比對取得其X/Y坐標值,以提高都市地區事故定位精度 。

交通事故地理資訊系統2/3

交通事故地理資訊系統3/3 國省道事故資料之空間定位 依里程數 透過位置參考系統進行 利用動態分段功能分別設定 LRS Datum為交通路網 路網之鍵值為道路名稱與里程起訖欄位名稱 Linear Reference Methods為依里程計算 Event Data為透過ODBC連結之事故點資料 事故資料之鍵值為道路名稱、事故發生里程

都市地區事故資料瀏覽

都市地區事故資料之空間分析1/3 以「交通部運輸研究所」與「台北體育場郵局」為中心500公尺半徑之範圍

都市地區事故資料之空間分析2/3 以「民權東路三段」之線形100公尺環域範圍,分析該範圍內之事故資料

都市地區事故資料之空間分析3/3 對所選取之行政區,作交叉路口的半徑範圍內之肇事當量的前10名排名 (肇事當量=9.5*死亡人數+3.5*受傷人數+ 總肇事次數)

國省道事故資料瀏覽

國省道事故資料之空間分析1/2 國道1號於15k至40k交通尖峰時段之A1與A2事故分佈

國省道事故資料之空間分析2/2 指定行政區範圍、分析時段、分析長度和每次移動距離,分析範圍內之道路,依肇事當量作排序

資料採礦(Data Mining) 資料採礦是一種在大量資料之資料庫中尋找有興趣、有價值的資訊或知識,所以資料採礦可說是結合統計理論、訊息理論與資料庫技術的一種資料分析機制。 進行資料採礦之要件 首先須定義清楚任務 針對每個不同的任務,再來決定須要什麼樣的資料 再從這些資料中找出其所須的特徵,這些特徵是可以區分出不同的類別且具代表性,而它所表現的地方就是要選的屬性 觀察效能,成本效益,是否可以產出更高的利潤 過程都必須是可以被量測的

資料採礦之進行步驟 釐清目標與理解資料 獲取相關技術與知識 整合與查核資料 去除錯誤或不一致及不完整的資料 由資料選取樣本先行試驗 建立模式與型樣 實際資料採礦分析工作 測試與檢核

資料採礦常用模式分類 Classification(分類) Prediction(預測) Association 運用已知的結果,結合其相關屬性,來推導出在資料中存在的規則及事實,方法包括類神經網路、決策樹、... 。 Prediction(預測) 運用歷史資料去預測未來變化, 如Regression、 Time-series 、... 。 Association 在找尋資料的關聯性。 找出在某一事件或是資料中會同時出現的東西。

資料採礦常用模式分類 Segmentation Sequence 使用區隔(Clustering)方法之類聚的現像,其主要區別在於Clustering並未於事前資料的屬性,而是直接做分群,再做資料分析;不同於Classification的是其已先定義每群資料,對每群資料的特性事前就知道。所以Classification是supervised學習,而Clustering是unsupervised學習。 Sequence 用來分析事件的發生是否有連續性,在時間序列上,依照經驗法則之趨勢分析。

Oracle 資料採礦模組-ODM 由Data Mining 應用程式介面(API)與Data Mining 伺服器(DMS)組成。 提供使用者利用java程式語言型資料分析工作。 應用程式介面參考Java Data Mining (JDM) 標準規範 JDM內容包括Object Management Group之通用倉儲詮釋(Common Warehouse Metadata,CWM), Data Mining Group (OMG)之Predictive Model Markup Language (PMML)與ISO最新版資料庫查詢語法之SQL/MM。 Data Mining 伺服器則為資料庫系統之伺服功能。

ODM模式建立與應用流程

ODM之模式建立 模式建立之任務設定檔 模式建立主程式 模式建立結果 資料型態、輸入資料來源、資料是否已處理狀況為unprepared或是discretized、目標屬性名稱、Naive Bayes 演算法之參數設定、任務名稱、模式名稱 模式建立主程式 資料庫連結、建立實體資料物件連結、建立資料採礦函數物件設定、執行模式建立工作 模式建立結果

ODM輸入資料處理 資料為”discretized”之BINNED與”unprepared”之UNBINNED之差異

ODM各採礦任務控制表格 odm_mining_model資料表格所儲存之模式 odm_mining_task資料表格所紀錄之各任務狀態 odm_test_result資料表格紀錄之各mining_task測試結果

事故資料分析試作1/5 資料項選擇 主要肇因 分駕駛人與非駕駛人因素 速限 天候 光線 路面狀況 道路障礙物與視距 號誌種類與狀況 標誌

事故資料分析試作2/5 資料前置處理 台北市74至90年事故件數為52150筆 資料缺失 主要肇因:空白約有20227筆 天候:異常值約有17筆 光線:異常值約有77筆 路面狀況:異常值約有210筆 道路障礙物與視距:異常值約有22筆 號誌種類與狀況:異常值約有242筆 標誌:異常值約有198筆

事故資料分析試作3/5 使用模式:Naïve Bayes Classifier 進行方式 Oracle ODM 檢核後之事故資料匯入Accident資料表。 修改Oracle所提供Naïve Bayes Classifier之Java範例程式,將其中之資料輸入與輸出方式改為本研究需求後即可使用。 模式建立後,以模式建立資料進行檢測模式之解釋能力。 Christian Borgelt http://fuzzy.cs.uni-magdeburg.de/~borgelt/doc/bayes/bayes.html 決定各屬性資料之值域(程式dom)。 產生Naïve Bayes Classifier模式(程式bci)。 執行Naïve Bayes Classifier之分析工作(程式bcx)。 計算confusion matrix以檢測模式之解釋能力(程式xmat) 。

事故資料分析試作4/5 Oracle ODM

事故資料分析試作5/5 Christian Borgelt之Naïve Bayes (期望值,變異數)[筆數]

結論 Oracle ODM之作法較複雜,也需java程式撰寫經驗,恐對非資訊專長之使用者形成障礙,但其與資料庫之整合程度較高,對資料量龐大之業務需求當可提高維護管理之效益,且同時提供Naive Bayes Classifier與Association Rules函數之PMML之匯入與匯出功能,提高模式之交換能力為其優點。 本次試作僅進行Data Mining之整體操作,驗證其實用性。因此後續仍有許多工作要進行,其中如前所述最費時的資料準備工作,甚或會佔掉整各計畫50%之能量。 本研究希望先行導入Data Mining技術於交通事故分析工作,並期望陸續將之推廣至交通運輸其他領域,如車流資料分析、家庭旅次行為分析、…等課題。

簡報結束 敬請指教