PART 2 技術 Chapter 3 組織資料與資訊
原則與學習目標 資料管理與建立模型是整理資料與資訊的關鍵 設計良好與管理良好的資料庫在決策支援方面是極有價值的工具 資料庫應用程式的數量與種類將持續成長並且產生真正的商業利益
原則與學習目標(續) 定義一般的資料管理概念與名詞,強調以資料庫方式進行資料管理的好處 描述關聯式資料庫模型,並且概述其基本功能 認識所有資料庫管理系統都會執行的共通功能,以及列舉一些較普遍的使用者資料庫管理系統 認識與簡要討論目前的資料庫應用程式
簡介 資料庫是一個有組織的資料集合,也應該輔助企業組織達成其目標 資料庫管理系統 (DBMS) 由一群操作資料庫的程式所組成,提供資料庫與使用者或資料庫與其他應用軟體之間的介面 資料庫管理師 (DBA) 是有技術且受過訓練的 IS 專業人員,可以主導與企業所屬資料庫有關的所有活動
簡介(續) 行銷經理可以從問卷調查中,取得現有與潛在顧客的大量資料、他們的網路使用習慣以及過去的採購記錄 公司的法律顧問可以從成熟的法律資料庫中,找出過去的案例和法律見解 人事部門經理可以利用資料庫分析調薪的影響、員工保險福利以及退休對公司長期成本的貢獻
資料管理 如果沒有資料與處理資料的能力,企業將無法成功的完成大部份的商業活動 資料是由原始數據所組成 若要轉換成有用的資訊,資料必須先經過有意義的方法加以整理 管理資訊系統概論, chapter3 , 頁142
資料的階層 位元 (二進位數字) 用來表示電路中的開或關 8 個位元可以組合成位元組 字元是建立資訊的基礎,每個位元組代表一個字元,包括大寫字母、小寫字母、數字或特殊符號 欄位通常是名稱、數值或是用來描述商業物件或活動的字元組合 管理資訊系統概論, chapter3 , 頁142
資料的階層(續) 將相關的資料欄位組合起來稱為資料記錄 相關的記錄可以組合成檔案 階層的最上層為資料庫,包含許多相關與整合的檔案 位元、字元、欄位、記錄、檔案及資料庫共同形成資料階層 管理資訊系統概論, chapter3 , 頁142
圖3.1 資料階層 資料庫 檔案 記錄 欄位 字元(位元組) 管理資訊系統概論, chapter3, 頁143
資料實體、屬性與鍵 實體泛指人、事、地或物,其資料需要收集、儲存與維護者 屬性是某個實體的性質 某個屬性的明確指定值則稱為資料項 索引鍵是指某一個記錄中可以用來識別該記錄的一個或一組欄位 主索引鍵則是可以唯一識別該記錄的一個或一組欄位 管理資訊系統概論, chapter3, 頁143
圖3.2 索引鍵與屬性 員工編號 姓 名 僱用日期 部門編號 005-10-6321 Johns Francine 10-07-1997 257 549-77-1001 Buckley Bill 02-17-1979 632 098-40-1370 Fiske Stevem 01-05-1985 598 管理資訊系統概論, chapter3, 頁143
資料庫方法 傳統式資料管理 造成資料重複性 影響資料完整性 資料庫式資料管理 多個應用程式可共用一群相關資料的資料管理方式 管理資訊系統概論, chapter3, 頁144
圖3.3 資料庫式的資料管理 管理資訊系統概論, chapter3, 頁145
表3.1 資料庫方法的優點 管理資訊系統概論, chapter3, 頁146
表3.1 資料庫方法的優點(續) 管理資訊系統概論, chapter3, 頁146
表3.2 資料庫方法的缺點 缺點 優點 比較複雜 DBMS比較難設立與操作,許多決定必須正確,DBMS才能夠有效的運作。另外,使用者必須學習新的程序才能發揮DBMS的全部好處 發生故障時比較難復原 在傳統式資料管理中,如果有某個檔案毀損,只會影響到一個程式。但是DBMS中的故陪可能會造成整個資料庫當機 比較昂貴 DBMS的價格比較昂貴,它的費用包括資料庫與特別人事費用等成本,如設計與操作資料庫資理師薪資就很高。另外,可能還需要一些額外的硬體裝置 管理資訊系統概論, chapter3, 頁146
資料模型與關聯式資料庫模型 建立資料庫時,企業組織必須仔細的考慮下列幾個問題: 內容:應該收集哪些資料以及該花多少成本? 存取:應該提供哪些資料給哪些使用者以及何時提供? 邏輯結構:資料應該如何安排才能讓指定的使用者覺得合理? 實體組織方式:資料應該實際儲放在哪裡? 管理資訊系統概論, chapter3, 頁147
建立資料模型 建立資料庫需要兩個不同設計:邏輯設計與實體設計 邏輯設計是抽象模型,定義資料庫應該如何結構與安排,才能符合企業組織的資訊需求 管理資訊系統概論, chapter3, 頁147
建立資料模型(續) 實體設計則是從邏輯資料庫的設計開始,再以效能和成本的考量進行微調 資料模型是由實體與各實體之間的關聯所組成的圖表 實體關係圖是使用基本的圖形符號,顯示企業組織的資料,以及這些資料間的關聯性 管理資訊系統概論, chapter3, 頁147
圖3.4 顧客訂單資料庫的實體關係圖 業務員 顧客 訂單 明細項目 產品 發票 服務 訂購 指定 包含 產生 管理資訊系統概論, chapter3, 頁148
關聯式資料庫模型 關聯式模型是使用標準的列表格式來描述資料 在使用關聯式模型建構的資料庫中,所有的資料項目都放在二維的表格中,稱為「關聯表」 關聯式資料庫中的資料表是以資料列與資料行來組織資料 管理資訊系統概論, chapter3, 頁149
關聯式資料庫模型(續) 資料表中的每一資料列 (記錄) 代表一個資料實體 資料表中的資料行 (欄位) 則代表其屬性 每一個屬性只能接受某一類的值,這些屬性的可接受值稱為定義域 管理資訊系統概論, chapter3, 頁149
圖3.5 關聯式資料庫模型 管理資訊系統概論, chapter3, 頁149
操作資料 選取是根據某些條件來選擇需要的資料列,而將不需要的資料列消除 投影是消除資料表中的資料行 合併是結合兩個或多個資料表 連結是操作兩個或兩個以上具有共通資料屬性的資料表,提供有用的資訊與報表 管理資訊系統概論, chapter3, 頁150
圖3.6 簡化版ER圖顯示經理人、部門與專案資料表之間的關聯 管理 部門 執行 專案 管理資訊系統概論, chapter3, 頁151
圖3.7 連結資料表以回應查詢 管理資訊系統概論, chapter3, 頁152
資料庫管理系統 DBMS 是由一群操作資料庫的程式所組成,可以當成資料庫與使用者或資料庫與其他應用軟體之間的介面 建立與實作正確的資料庫系統,才能確保資料庫可以支援商業活動與達成商業目標 管理資訊系統概論, chapter3, 頁153
資料庫類型概述 平面檔案是簡單的資料庫程式,資料記錄之間彼此沒有關聯性 個人電腦使用的資料庫通常是單一使用者的資料庫,亦即資料庫一次只能讓一個人使用 多重使用者的 DBMS可以允許幾百人同時存取資料庫系統 管理資訊系統概論, chapter3, 頁154
提供使用者檢視 綱要是對整個資料庫的描述 大型資料庫系統通常會以綱要來定義資料表,以及和某位人員或使用者有關的其他資料庫功能 管理資訊系統概論, chapter3, 頁155
建立與修改資料庫 資料庫定義語言 (DDL) 是一群指令或命令,用來定義與描述某個特定資料庫中的資料與關聯 資料字典用來詳細描述資料庫中使用的所有資料 管理資訊系統概論, chapter3, 頁155
圖3.10 使用資料定義語言定義網要 管理資訊系統概論, chapter3, 頁156
儲存與擷取資料 當某個應用程式需要資料時,它必須循邏輯存取路徑向 DBMS 要求這項資料 管理資訊系統概論, chapter3, 頁157
圖3.11 典型的資料字典項目 管理資訊系統概論, chapter3, 頁156
圖3.12 邏輯與實體存取路徑 DBMS 管理要求 其他軟體 應用程式 實體存取路徑(PAP) 邏輯存取路徑 (PAP) 儲存裝置上的資料 圖3.12 邏輯與實體存取路徑 實體存取路徑(PAP) DBMS 邏輯存取路徑 (PAP) 管理要求 其他軟體 應用程式 管理資訊系統概論, chapter3, 頁157
操作資料與產生報表 實例查詢(QBE)是以視覺化方法來開發資料庫的查詢或要求 資料操作語言 (DML)可以讓使用者存取、修改以及查詢資料庫中的資料,然後產生報表 管理資訊系統概論, chapter3, 頁158
操作資料與產生報表(續) 美國國家標準局 (ANSI) 於 1986 將 SQL 定為關聯式資料庫的標準查詢語言 DBMS 可以產生許多種類的文件、報表以及可以幫助企業組織達成目標的其他輸出 管理資訊系統概論, chapter3, 頁158
表3.3 SQL指令範例 管理資訊系統概論, chapter3, 頁159
資料庫管理 DBA 通常被期望能夠清楚的了解企業組織的本業、能夠熟練的使用選擇的資料庫管理系統,以及隨時跟上新興科技與新的設計方法 管理資訊系統概論, chapter3, 頁161
較普遍的資料庫管理系統 較普遍的單一使用者 DBMS 有 Microsoft Access 與 FileMaker Pro 完整的資料庫管理的軟體市場包含IBM、Oracle 與 Microsoft 開放原始碼的資料庫管理系統包括 PostgreSQL 與 MySQL 許多傳統的資料庫程式現在也都可以在開放原始碼的作業系統上執行 管理資訊系統概論, chapter3, 頁162
特殊用途的資料庫系統 有些特殊用途的資料庫軟體也會應用在特殊目的或特殊產業 以色列大屠殺資料庫 (www.yadvashem.org) 由澳洲國家職業健康與安全委員會開發的 Hazmat 資料庫 Art and Antique Organizer Deluxe 則是可以用來分類藝術品和古董的特殊資料庫 由 Tableau 開發的資料庫可以用來儲存與處理視覺影像資料 管理資訊系統概論, chapter3, 頁163
選擇資料庫管理系統 資料庫的重要性質有: 資料庫大小:資料庫中的記錄數或檔案數 資料庫成本:資料庫的採購或租用成本 並行使用者:同時使用資料庫的人數 (並行使用者的人數) 管理資訊系統概論, chapter3, 頁163
選擇資料庫管理系統(續) 資料庫的重要性質有: 執行效能:資料庫更新記錄的速度有多快 整合性:與其他應用程式和資料庫整合的能力 開發廠商:資料庫開發廠商的聲譽以及財務穩定程度 管理資訊系統概論, chapter3, 頁163
使用資料庫與其他軟體 資料庫管理系統通常會與其他套裝軟體或網際網路一起使用 DBMS 可以當成前端應用程式或後端應用程式 前端應用程式是直接與使用者互動的部份 後端應用程式是直接與其他程式或應用軟體互動的部份,與使用者的互動則是間接的 管理資訊系統概論, chapter3, 頁164
資料庫應用程式 資料庫應用系統可以操作資料庫的內容,提供有用的資訊給使用者 常見的操作有透過許多不同資料庫應用程式,對資料庫內的資料進行搜尋、過濾、合成以及吸收等動作 管理資訊系統概論, chapter3, 頁165
連結資料庫與網際網路 連結資料庫與網際網路對許多企業組織與個人而言是非常重要的 將傳統資料庫與網際網路做緊密的結合通常稱為「語意網」 語意網可以讓人們在使用網際網路的同時存取與操作許多傳統資料庫 管理資訊系統概論, chapter3, 頁165
資料倉儲、資料超市與資料探勘 資料倉儲是一個資料庫,包含企業中各項來源的商業資訊,包括與公司的流程、產品以及顧客有關的資料 資料倉儲提供企業使用者分析商業條件時所需的多維度資料檢視,它可以讓經理們以「分層處理」或稱向下鑽取的方式取得更詳細的資料,或是以「向上捲算」或稱向上鑽取的方式取得詳細資料以及產生總計或彙總報表 管理資訊系統概論, chapter3, 頁166
資料超市是將資料倉儲的概念帶入小型或中型的企業,或是大型公司內的部門 資料倉儲、資料超市與資料探勘(續) 資料超市是資料倉儲的一個子集合 資料超市是將資料倉儲的概念帶入小型或中型的企業,或是大型公司內的部門 資料探勘是一種資訊分析工具,可以自動發掘資料倉儲中的模式與關聯 管理資訊系統概論, chapter3, 頁166
圖3.17 資料倉儲的元素 管理資訊系統概論, chapter3, 頁168
表 3.4 OLTP與資料倉儲的比較 管理資訊系統概論, chapter3, 頁171
商業智慧 商業智慧是以適時的方式與合用的形式收集足夠的正確資訊進行分析,以便對企業的策略、戰術或營運有正面的影響 商業智慧會將資料轉變成有用的資訊,然後散佈到整個企業 管理資訊系統概論, chapter3, 頁172
商業智慧(續) 競爭情報也是一種商業智慧,不過只限於競爭者的相關資訊,以及這些知識影響策略、戰術與營運的方式 反情報則是企業採取保護資訊的措施,以防止惡意的情報收集者搜尋公司的資訊 管理資訊系統概論, chapter3, 頁172
分散式資料庫 分散式處理是將很多處理單位放在不同的地方分散執行,然後透過電信設備彼此連結 分散式資料庫也是根據相同的原理,這種資料庫的資料可以分散到許多個較小的資料庫,然後透過電信裝置彼此連接 管理資訊系統概論, chapter3, 頁173
分散式資料庫(續) 分散式資料庫可以讓公司或其他企業組織在資料庫的組織和使用上更有彈性 複製資料庫包含常用資料的複製 公司會在需要時或預先設定的時間傳送重要資料的副本給每一個分散處理的地區,每一個地區也會在更新週期時將有變更的資料傳回給主資料庫以進行更新。這個處理過程通常稱為「資料同步」 管理資訊系統概論, chapter3, 頁173
必須對資料和它的商業環境有非常足夠的知識 必須相信資料探勘工具可以發掘出有根據且值得的假設前提 表 3.6 OLTP與資料探勘的比較 性質 OLAP 資料探勘 目的 支援資料分析與決策 支援的分析類型 由上而下、查詢式的資料分析 由下而上、發掘式的資料分析 使用者需要的技能 必須對資料和它的商業環境有非常足夠的知識 必須相信資料探勘工具可以發掘出有根據且值得的假設前提 管理資訊系統概論, chapter3, 頁175
物件導向式與物件關聯式資料庫管理系統 在物件導向式資料庫中: 會將資料與處理指令都儲存在資料庫中 「方法」是指一個程序或動作 「訊息」則是指執行某個方法的要求 管理資訊系統概論, chapter3, 頁175
物件導向式與物件關聯式資料庫管理系統(續) 物件導向式資料庫使用物件導向式資料庫管理系統 (OODBMS) 提供使用者介面以及和其他程式的連接 物件關聯式料庫管理系統 (ORDBMS) 則提供了完整的關聯式資料庫能力,再加上能夠讓協力廠商加上新的資料型態以及操作到資料庫的能力 管理資訊系統概論, chapter3, 頁176
視覺、聲音以及其他資料庫系統 視覺資料庫儲存影像 聲音資料庫儲存音訊 虛擬資料庫系統可以讓不同的資料庫一起合作,成為聯合的資料庫系統 空間資料技術是使用資料庫根據描述的位置來儲存以及存取資料,而且允許對空間資料進行查詢與分析 管理資訊系統概論, chapter3, 頁176
總結 資料是企業資產中最有價值的資源之一 資料是以階層方式組織 實體泛指人、事、地或物,其資料需要收集、儲存與維護者 屬性則是指某個實體的性質 傳統檔案式應用程式通常是程式與資料相互依存,亦即它的資料無法讓其他程式讀取 管理資訊系統概論, chapter3, 頁177
總結(續) 資料庫方法可以減少重複資料、改善資料一致性與整體性、容易修改與更新、資料與程式相互獨立、標準的資料存取方式,以及更有效率的程式開發 資料庫設計師通常會使用資料模型來顯示各資料之間的邏輯關聯性 資料模型則是由實體與各實體之間的關聯所組成的圖表 管理資訊系統概論, chapter3, 頁177
總結(續) 關聯式模型將資料儲存在二維的資料表格內,資料表之間可以經由共通的資料元素進行連結 DBMS 是一群程式,當成資料庫和它的使用者以及資料庫和其他程式之間的介面 DBMS 提供了四個基本功能:提供使用者檢視、建立與修改資料庫、儲存與擷取資料,以及操作資料與產生報表 管理資訊系統概論, chapter3, 頁177
總結(續) 選擇 DBMS 之前必須先對企業組織的資訊需求進行分析 資料庫重要的性質包括資料庫大小、並行使用者的人數、執行效能、DBMS 整合其他系統的能力、DBMS 的功能、開發廠商的考量,以及資料庫管理系統的成本 管理資訊系統概論, chapter3, 頁177
總結(續) 資料倉儲也是一個關聯式資料庫管理統,特別設計用來支援管理的決策 資料超市則是資料倉儲的一個小部分,通常只針對某個特殊目的或某個特定的業務功能領域 資料探勘則會自動發掘資料倉儲中的模式與關聯 管理資訊系統概論, chapter3, 頁177
總結(續) 商業智慧是一個流程,以適時的方式與合用的形式收集足夠且正確的資訊進行分析,以便對企業的策略、戰術或營運有正面的影響 競爭情報也是一種商業智慧,不過只限於競爭者的相關資訊,以及這些知識影響策略、戰術與營運的方式 管理資訊系統概論, chapter3, 頁177
總結(續) 反競爭情報則是指企業採取保護資訊的措施,防止惡意情報收集者搜尋公司的資訊 物件導向式資料庫使用與物件導向程式設計完全相同的方式,這個方式會將資料與處理指令都儲存在資料庫中 管理資訊系統概論, chapter3, 頁177
總結(續) 反物件關聯式料庫管理系統 (ORDBMS) 則提供了完整的關聯式資料庫能力,再加上能夠讓協力廠商加上新的資料型態以及操作到資料庫的能力 管理資訊系統概論, chapter3, 頁177