永續運輸資訊系統 -交通事故資料分析研究周家慶高級分析師交通部運輸研究所.

Slides:

Advertisements

Similar presentations

学生、幼儿意外伤害保险  被保险人在深圳市取得合法办学资格的全日制大中小学校、中等职业学校（包括普通中专、成人中专、职业高中和技工学校）、特殊教育学校、幼儿园在籍（园）学生。

Advertisements

平衡飲食保健強身整理至簡體版，作者不可考。內容為參加國際健康會議所發表的心得。. 人應該活多久有人告訴我五六十歲就差不多了。我在醫院工作四十年了，絕大部分病死的人是很痛苦的。我在美國遇見張學良，一進門見到他就大吃ㄧ驚，他眼不花，耳不聾，很多人問他：少帥，您怎麼能活這麼久？他回答：不是我活的久，是他們活的太短了。

偵辦侵害營業秘密犯罪之執行情形法務部調查局. 一、前言 ( 一 )102 年 1 月 30 日公告施行營業秘密法 ( 一 )102 年 1 月 30 日公告施行營業秘密法修正案，增加侵害營業秘密之刑事修正案，增加侵害營業秘密之刑事責任，對於意圖在境外使用而竊取責任，對於意圖在境外使用而竊取.

腫瘤個案管理師之職責與作業乳癌個案管理師 : 陳慧蘭. 腫瘤個案管理師之職責  收案  評估病家需求  擬訂及提供照護計畫  參與多專科共同照護  提供追蹤管理  品質監測及回饋.

1 計量技術人員考訓制度. 2 簡報大綱計量考訓制度簡介應考須知說明考試範圍內容、題型及配分權重.

徐州工业职业技术学院. 人才市场需求 2013 年我国安全类专业统计表学历层次专业名称专业代码毕业生数招生数在校生数开设学校数本科安全工程专科安全技术管理中专 0000.

天文信息学的思考国家天文台赵永恒 2011 年 11 月. 2 X-informatics 生物信息学化学信息学医学信息学水信息学地理信息学（系统）空间信息科学与技术.

创意鄱阳湖— 一种基于无形资源理念开发鄱阳湖的思考以传奇背景音乐作为开场，体现创意创造传奇南昌大学黄细嘉

联合国提出个口号：“千万不要死于无知” 保健的三个里程碑平衡饮食有氧运动心理状态.

防盜裝置　學生科技探究.

MRP到ERPII之演進 1970年代 1980年代 1990年代 2000年代企業應用軟體 MRP MRPII ERP EERP

饮食中的平衡酸性食物与碱性食物.

平衡飲食保健強身.

上海九晶电子材料股份有限公司招聘简章.

系統分析與設計第九章資料設計.

Presentation of Big Data Issues

政府採購錯誤行為態樣報告人：張錦川日　期：96年7月.

第五章資訊科技基礎建設與新興科技.

C语言程序设计李伟光.

現代中國議題: 「一帶一路」.

农信社信贷产品实务技能提升培训.

2009年周口市公共机构高效照明产品推介会

教學經驗分享吳毅成國立交通大學資訊工程系 2012年4月.

数据分析及研究方法 ——以如何从事宏观经济课题研究为例

高齡者道路交通事故特性與道安防制措施研究計畫報告

一、平面点集定义: x、y ---自变量，u ---因变量. 点集 E ---定义域， --- 值域.

採購法規概要報告人：臺北市政府法規委員會編審陳世超土木技師高考及格結構技師高考及格公務人員高考及格國立中興大學土木工程碩士

運輸安全白皮書（Ⅲ）軌道安全篇主辦單位：運輸安全組.

第六章資料倉儲與採礦技術 6.1 資料倉儲與採礦定義 6.2 資料採礦之步驟與技術分類 6.3 資料採礦在顧客關係管理之應用

中国技术交易信息服务平台中国技术市场管理促进中心.

微博红人：留几手.

招投标知识培训培训人：日期：2011年04月08日西安翼舞时风数码科技有限公司.

採購法規概要報告人：臺北市政府法規委員會編審陳世超土木技師高考及格結構技師高考及格公務人員高考及格國立中興大學土木工程碩士

植物辨識及分類呂春森基隆市立暖暖高級中學植物辨識及分類呂春森基隆市立暖暖高級中學.

『兩岸四地－校園節能文化推廣』座談會 2008年1月26日澳門大學校園管理總監宋傑堯.

中国教科文卫体工会全国委员会陈志标（2012年5月9日，中山大学）

管理学基本知识.

第三课闲话“家”常 1.

滁州学院首届微课程教学设计竞赛课程名称：高等数学主讲人：胡贝贝数学与金融学院.

“华东师大数学系部分老同事活动”（辛卯聚会）记事

第五节　读图表述.

財團法人中華民國證券櫃檯買賣中心交易部中華民國101年8月

东宝大厦简介及服务特色.

滨海学坛周刊总第13期 2012年10月22日本期编辑：李秀青温州滨海学校教科室主办.

质量管理刘春霞

拾貳、教育行政一、教育行政的意義教育行政，可視為國家對教育事務的管理，以增進教育效果。教育行政，乃是一利用有限資源在教育參

科學科污染空氣成因的：題目及減少空氣污染的方法陳玉玲 (4) 姓名：去到目錄.

課程銜接九年一貫暫行綱要( )  九年一貫課程綱要( ) 國立台南大學數學教育系謝堅.

正、反比例意义的巩固练习.

2.4 二元一次方程组的应用(1).

國內發展PACS之回顧與展望黃興進彭振興連俊瑋國立中正大學資訊管理學系國立中正大學醫療資訊管理研究中心

Some Effective Techniques for Naive Bayes Text Classification

財物及勞務採購作業程序及注意事項報告人劉麗琴

第五章信息与系统集成技术概述数据流集成技术信息流集成技术信息管理集成技术流程重组与业务流程集成企业门户集成企业集成架构

運籌管理 Chapter 12 資訊科技與運籌管理電子化祝天雄博士 99年12月日.

資料探勘-案例期末報告 SQL Server 2008 Analysis Service

物联网数据处理第一讲数据处理基本概念刘进军 QQ：

常見的巨量資料分析與應用楊立偉教授台大工管系暨商研所 2018.

SOA模型设计杨子 2009/09/30.

第十章線上行銷研究.

R與資料探勘(data mining)簡介

第十二章顧客關係管理.

中国农业科学院博士后学术论坛博士后基金申请的经验及体会中国农业科学院生物技术研究所秦华博士

An Quick Introduction to R and its Application for Bioinformatics

方案假設因果連結 (如果…就會…) 將問題情況轉變為所需服務確保方案的合理性利於方案評估例：青少年墮胎

方格紙上畫正方形.

台灣房價指數台灣房屋中央大學 2011年7月29日.

用加減消去法解一元二次聯立方程式台北縣立中山國中第二團隊.

Presentation transcript:

永續運輸資訊系統 -交通事故資料分析研究周家慶高級分析師交通部運輸研究所

簡報內容背景交通事故資料庫與地理資訊系統資料採礦(Data Mining) Oracle 之資料採礦模組試作過程結論與建議 Oracle Data Mining (ODM) 試作過程結論與建議

背景運輸研究所進行「交通事故資料庫系統」研究及其分析與設計評估交通事故分析所需之資料庫來源探討，包括死因資料庫、健保資料庫、保險資料庫、事故資料庫等。「交通事故地理資訊系統資料庫建置」進行國省道與臺北市事故資料之實作。本研究重點在探討各種資料庫之龐大資料量狀況下，如何利用資料採礦架構進行事故資料分析工作。本架構將為永續運輸資訊系統中之基本資料庫，而永續運輸資訊系統之發展目的乃是希望成為政府從事交通施政成效評估、區域交通建設發展比較與交通成長變化追蹤分析等重要工作之重要工具。

交通事故分析相關資料庫1/3 死因檔死因資料係記錄我國國民死亡之有關資料，每位當年死亡者的資訊均以一筆記錄儲存於死因檔中，而依據國際疾病傷害與死因分類標準，與道路交通事故直接相關的死因分類為ICD 碼E810至E819之運輸事故。事故檔道路交通事故料係A1、A2及A3類道路交通事故案件內容，每一事故案件所記錄之資料可分成事故地點、事件本身、涉案當事人三部份，此三部份之資料分別儲存三個資料表格，彼此間以發生時間-年+序號為串連之鍵，來連結同屬一件事故的人、事、地資料。

交通事故分析相關資料庫2/3 汽車保險資料檔門診檔與住院檔資料檔包括一般車險及強制汽車責任險兩部份，保險從業人員處理保險事件時，其係依據投保、理賠等處理階段與保險種類之不同，而填具不同的書面資料，包括：一般車險與強制汽車責任險個別之保單資料、批單資料、理賠申請書、理賠計算書、求償計算書，此些資料在資料記錄方式、資料庫結構設計方式上彼此相連結。門診檔與住院檔健保資料庫記錄民眾以健康保險方式就醫之各種資料，所用之資料檔為門診處方及治療明細資料檔以及住院醫療費用清單資料檔。

交通事故分析相關資料庫3/3

交通事故地理資訊系統1/3 都市地區事故資料之空間定位市區交通事故，以地址或交叉路口進行發生地點的描述。以完整且正確的門牌地址資料庫進，提高事故地點的定位精度，台北市門牌地址的地理資訊資料庫。交叉路口型事故資料則透過交叉道路之路名與電子地圖之道路名稱比對取得其路口X/Y坐標值，同時亦針對事故位置資料中之地標/地物與電子地圖之地標/地物比對取得其X/Y坐標值，以提高都市地區事故定位精度。

交通事故地理資訊系統2/3

交通事故地理資訊系統3/3 國省道事故資料之空間定位依里程數透過位置參考系統進行利用動態分段功能分別設定 LRS Datum為交通路網路網之鍵值為道路名稱與里程起訖欄位名稱 Linear Reference Methods為依里程計算 Event Data為透過ODBC連結之事故點資料事故資料之鍵值為道路名稱、事故發生里程

都市地區事故資料瀏覽

都市地區事故資料之空間分析1/3 以「交通部運輸研究所」與「台北體育場郵局」為中心500公尺半徑之範圍

都市地區事故資料之空間分析2/3 以「民權東路三段」之線形100公尺環域範圍，分析該範圍內之事故資料

都市地區事故資料之空間分析3/3 對所選取之行政區，作交叉路口的半徑範圍內之肇事當量的前10名排名 (肇事當量=9.5*死亡人數+3.5*受傷人數+ 總肇事次數)

國省道事故資料瀏覽

國省道事故資料之空間分析1/2 國道1號於15k至40k交通尖峰時段之A1與A2事故分佈

國省道事故資料之空間分析2/2 指定行政區範圍、分析時段、分析長度和每次移動距離，分析範圍內之道路，依肇事當量作排序

資料採礦(Data Mining) 資料採礦是一種在大量資料之資料庫中尋找有興趣、有價值的資訊或知識，所以資料採礦可說是結合統計理論、訊息理論與資料庫技術的一種資料分析機制。進行資料採礦之要件首先須定義清楚任務針對每個不同的任務，再來決定須要什麼樣的資料再從這些資料中找出其所須的特徵，這些特徵是可以區分出不同的類別且具代表性，而它所表現的地方就是要選的屬性觀察效能，成本效益，是否可以產出更高的利潤過程都必須是可以被量測的

資料採礦之進行步驟釐清目標與理解資料獲取相關技術與知識整合與查核資料去除錯誤或不一致及不完整的資料由資料選取樣本先行試驗建立模式與型樣實際資料採礦分析工作測試與檢核

資料採礦常用模式分類 Classification(分類) Prediction(預測) Association 運用已知的結果，結合其相關屬性，來推導出在資料中存在的規則及事實，方法包括類神經網路、決策樹、... 。 Prediction(預測) 運用歷史資料去預測未來變化，如Regression、 Time-series 、... 。 Association 在找尋資料的關聯性。找出在某一事件或是資料中會同時出現的東西。

資料採礦常用模式分類 Segmentation Sequence 使用區隔(Clustering)方法之類聚的現像，其主要區別在於Clustering並未於事前資料的屬性，而是直接做分群，再做資料分析；不同於Classification的是其已先定義每群資料，對每群資料的特性事前就知道。所以Classification是supervised學習，而Clustering是unsupervised學習。 Sequence 用來分析事件的發生是否有連續性，在時間序列上，依照經驗法則之趨勢分析。

Oracle 資料採礦模組-ODM 由Data Mining 應用程式介面(API)與Data Mining 伺服器(DMS)組成。提供使用者利用java程式語言型資料分析工作。應用程式介面參考Java Data Mining (JDM) 標準規範 JDM內容包括Object Management Group之通用倉儲詮釋(Common Warehouse Metadata，CWM), Data Mining Group (OMG)之Predictive Model Markup Language (PMML)與ISO最新版資料庫查詢語法之SQL/MM。 Data Mining 伺服器則為資料庫系統之伺服功能。

ODM模式建立與應用流程

ODM之模式建立模式建立之任務設定檔模式建立主程式模式建立結果資料型態、輸入資料來源、資料是否已處理狀況為unprepared或是discretized、目標屬性名稱、Naive Bayes 演算法之參數設定、任務名稱、模式名稱模式建立主程式資料庫連結、建立實體資料物件連結、建立資料採礦函數物件設定、執行模式建立工作模式建立結果

ODM輸入資料處理資料為”discretized”之BINNED與”unprepared”之UNBINNED之差異

ODM各採礦任務控制表格 odm_mining_model資料表格所儲存之模式 odm_mining_task資料表格所紀錄之各任務狀態 odm_test_result資料表格紀錄之各mining_task測試結果

事故資料分析試作1/5 資料項選擇主要肇因分駕駛人與非駕駛人因素速限天候光線路面狀況道路障礙物與視距號誌種類與狀況標誌

事故資料分析試作2/5 資料前置處理台北市74至90年事故件數為52150筆資料缺失主要肇因：空白約有20227筆天候：異常值約有17筆光線：異常值約有77筆路面狀況：異常值約有210筆道路障礙物與視距：異常值約有22筆號誌種類與狀況：異常值約有242筆標誌：異常值約有198筆

事故資料分析試作3/5 使用模式：Naïve Bayes Classifier 進行方式 Oracle ODM 檢核後之事故資料匯入Accident資料表。修改Oracle所提供Naïve Bayes Classifier之Java範例程式，將其中之資料輸入與輸出方式改為本研究需求後即可使用。模式建立後，以模式建立資料進行檢測模式之解釋能力。 Christian Borgelt http://fuzzy.cs.uni-magdeburg.de/~borgelt/doc/bayes/bayes.html 決定各屬性資料之值域(程式dom)。產生Naïve Bayes Classifier模式(程式bci)。執行Naïve Bayes Classifier之分析工作(程式bcx)。計算confusion matrix以檢測模式之解釋能力(程式xmat) 。

事故資料分析試作4/5 Oracle ODM

事故資料分析試作5/5 Christian Borgelt之Naïve Bayes (期望值，變異數)[筆數]

結論 Oracle ODM之作法較複雜，也需java程式撰寫經驗，恐對非資訊專長之使用者形成障礙，但其與資料庫之整合程度較高，對資料量龐大之業務需求當可提高維護管理之效益，且同時提供Naive Bayes Classifier與Association Rules函數之PMML之匯入與匯出功能，提高模式之交換能力為其優點。本次試作僅進行Data Mining之整體操作，驗證其實用性。因此後續仍有許多工作要進行，其中如前所述最費時的資料準備工作，甚或會佔掉整各計畫50%之能量。本研究希望先行導入Data Mining技術於交通事故分析工作，並期望陸續將之推廣至交通運輸其他領域，如車流資料分析、家庭旅次行為分析、…等課題。

簡報結束敬請指教