QlikView BI設計實務 第七章QlikView BI ETL

Slides:



Advertisements
Similar presentations
实用农业科技写作 王鹏文. 第一章 导论 第一节 农业科技写作概述 一 、 农业科技写作概念和分类: 科技文献类、科技应用类、 科技普及类、科技新闻类 二、 农业科技写作的意义和重要性: 科技工作的重要组成部分、科学研究的手段、 科技成果的反映和标志、科技交流的工具 三、 农业科技写作的特点 : 功利性与及时性、科学性与先进性、读者的专门性与狭隘性、
Advertisements

新课程引领 实践中前行 —— 蓟县初中信息技术三年课改总结. 自从 2005 年秋季我市进入基础教育新一 轮课程改革实验以来,在市教研室的正 确领导下,我县初中信息技术课改工作 稳步推进。三年来,取得了一些成果, 也有不少体会。现将三年来的信息技术 课改工作总结如下。
簡報內容大綱  ( 一 ) 學校衛生政策  ( 二 ) 學校物質環境  ( 三 ) 學校社會環境  ( 四 ) 社區關係  ( 五 ) 健康教學與活動  ( 六 ) 健康服務.
美丽的鹿城 —— 包头 包头简介 包头旅游景区 包头美食. 包 头, 中国内蒙古自治区第一大城市,又称鹿城、草原钢城。 随着包头钢铁(集团)有限责任公司和包头稀土研究院的建成与 发展,这里又被称作稀土之都。 包头稀土研究院 包 头位于内蒙古自治区中部,东与呼和浩特市相邻,西与巴彦 淖尔盟市连接 ,北与蒙古国接壤.
河南省基础教育资源网 邓伟鹏 二〇一二年七月 内容大纲 1. 培训平台的目的 2. 培训平台介绍 3. 培训平台功能 4. 培训工作建立流程 5. 培训门户 6. 在线学习 6.1 课程学习 6.2 在线考试 7. 培训考试管理 7.1. 课程管理 7.2 必修学习班建立 7.3 在线考试管理 7.4.
桐乡市地方税务局 2013 年度社会保险费汇算清缴有 关政策及事项说明. 一、政策规定 根据《中华人民共和国社会保险法》、《桐乡市社会保险费征缴管 理办法》(市政府令第 42 号)、《 关于完善社会保险费征缴管理有关问 题的通知》(桐政办发 [2012]152 号)及《关于完善社会保险费征缴管理.
抗菌药物合理用药指标 2011年11月24日.
如何做一个明白人? 罗辑思维51期, 俞熹 2015年4月.
NO.005 職涯 報 實習 徵才 攻讀 國立嘉義大學 學生事務處學生職涯發展中心.
國中教育會考 十二年國教—免試入學 及 意見整理.
糖尿病健康教育 广水市健康教育所 (2).
第6章 应收应付款管理.
顧客交易紀錄分析實務 概述 26.2 資料分析的過程 26.3 顧客交易紀錄分析說明 26.4 實作一、顧客活動剖析實務演練
青岛, 一座有故事的城市…… 刘瑞昌 青岛理工大学汽车与交通学院 2013年12月.
严格标准 规范程序 认真做好党员发展工作.
薪資申報系統操作說明.
商学院 旅游管理专业介绍.
 历史以人类的活动为特定的对象,它思接万载,视通万里,千恣百态,令人销魂,因此它比其他学科更能激发人们的想像力。    
健康一二一 宜兴市疾病预防控制中心 周 茜
等你知道 但以理書4.
《数学》(华师大.八年级 下册) 第二十一章数据的整理与初步处理 扇形统计图的制作.
抗菌药物临床应用管理规定.
中国古代诗歌散文欣赏 地点:福建福州 报告人:张华娟.
怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 (学院、部门适用)
第六章 資料倉儲與採礦技術 6.1 資料倉儲與採礦定義 6.2 資料採礦之步驟與技術分類 6.3 資料採礦在顧客關係管理之應用
第十六章 股票交易資訊分析與試算 課前指引 目前最熱門的理財方式莫過於投資股票市場,因此本章首先講解如何從美國股市匯入重要資料,之後教授使用WEB查訊功能,匯入台灣股市即時或盤後交易資訊到Excel工作表中,再利用資料分析工具來協助瞭解個股。最後再利用Excel圖表功能來繪製成股票K線圖,這是不是很有趣及實用呢?
『臺北市營建剩餘資源管理系統』 教育訓練說明 臺北市政府 報告人 王宏正
电子表格工作簿的操作 和数据的处理 感谢各位领导和老师的莅临与指导! 授课人:幸福人寿邵阳中心支公司 银保部王晚英.
小组成员 杨云、王雯、曾明发 刘凤、祝会、陈丹凤.
“三项制度+一个平台”构建 省级高校教学质量监控体系
瓯海职专财经专业组简介.
                                         減肥.
国有资产清查 数据填报操作规范 2016年3月25日.
大 綱 重大變革事項 甄選員額 甄選資格 甄選期程 軍官基礎教育與服役.
第三章 企业资信评估 第一节 企业资信评估概述 一、企业资信评估的含义
钞坑安置区项目简介.
中国的富饶之地 —东北.
上海文会会计师事务所有限公司 中国注册会计师 童幸义
報告人:財團法人台灣癌症基金會執行長 賴基銘 醫師
关于成绩的数理统计的探讨 望您多多指教!多谢!!.
仓储企业岗位人员招聘 第一组 组员 :陈娇娇 祝婷婷 丁元莉 袁珮 王慧.
海关特殊监管区域整合优化情况介绍 加贸司 杨旭 二零一四年九月十一日.
100學年度高職校務評鑑簡報 報告人:校長 江銘鉦 日期:101年4月27日
人口与计划生育 统计分析 昌吉市计划生育委员会 二○○六年三月.
健康減重飲食 高雄國軍總醫院 營養師余惠婷.
金門縣多年國小101學年度 推動健康促進學校成果簡報
前不久看到了这样一则报道:某个大学校园里,一个大学生出寝室要给室友留一张字条,告诉他钥匙放在哪里。可是“钥匙”两个字他不会写,就问了其他寝室的同学,问了好几个,谁也不会写,没办法,只好用“KEY”来代替了。 请大家就此事发表一下自己看法。
財務管理 E組 周玉蔻 林宥瑩 倪健育葉欣蓁 白貢帆 林聖峰蔡政華
2014年深圳市学生人身意外伤害保险投保工作介绍 中国人民财产保险股份有限公司深圳市分公司
第 4 章 CRM資料倉儲.
利用共同供應契約 辦理大量訂購流程說明.
線上分析處理、 資料採礦與 Analysis Services
递推算法 递推是一种重要的数学方法,在数学和计算机领域都有广泛应用。这种算法的特点是:一个问题的求解需要一系列的计算,在已知条件和所求问题之间总存在某种相互联系的关系。在计算时,可以找到前后过程间的数量关系,即递推。递推算法包括顺推和逆推。 递推算法的关键在于找到相邻数据项之间的关系,即递推关系,建立递推关系式。我们有时将递推算法看成一种特殊的迭代算法。
第5章 資料倉儲的資料建置.
走出生命的低谷, 進入上帝的富足 新營靈糧堂 Jan., 20, 2013.
法規王 用戶回訓活動 囊括勞動、消防、環保與全國法規資料庫 Speaker : Atlas.
办学条件核查 评估秘书组 电力职业技术学院 山西机电职业技术学院 2014年7月9日.
学习目标 1、什么是表连接 2、表连接类型 3、表连接区别.
科 展 說 明.
怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 (项目经费适用)
兒童及少年保護、 家庭暴力及性侵害事件、 高風險家庭 宣導與通報
舊生升級編班與新生管理操作說明 全誼資訊股份有限公司 中華民國106年06月05日.
軍校與民間大學之比較 軍校 民間大學 服裝食宿學雜費 由國家供給 除公費生外餘須自費 零用金 每月14,190元 父母供應或打工賺取 畢業
第4章 Excel电子表格 Excel操作必须掌握的知识点: 掌握建立、打开、保存和编辑文档的基本操作 ;
新课程理念下如何进行课堂教学 刘志超 2014年2月25日.
K/3CloudV6.1预算管理 陈琦琨 K/3Cloud预算与分析部.
(注意)表示的飽和度、亮度是基準值。因為色頻的關係,有可能有所調整。
教材计划管理模块 注意要点: 教师自编讲义,出版社设置为自编讲义,由学院负责发给学生;
6 分析資料-以統計測量數呈現.
主日學早會 Jan 17, 2016.
Presentation transcript:

QlikView BI設計實務 第七章QlikView BI ETL 講師:吳文宗

目錄 一、ETL的處理說明 二、ETL的關聯說明 三、ETL的其他應用 四、集合運算使用定值 五、集合範例

一、 ETL的處理說明 在商業智慧導入過程中,將所需要的異質性資料,透過一個ETL(粹取、轉換、清理、載入)的轉換程序,將不同格式的資料檔案或資料庫,粹取所選取的資料、轉換成正確的資訊、清除重複不需要的資料後,轉至一個統一的資料倉儲資料庫 ETL的程序可以用工具軟體來處理,也可以撰寫程式來處理,或用資料庫的Store Procedure來處理。

ETL的處理說明 傳統的BI專案導入過程中,ETL是一個龐大的工程。每個過程都有獨立的產品,各產品之間的整合相當複雜。

ETL的處理說明 QlikView BI是一個將 ETL、DataBase、DashBoard、OLAP、Reporting等功能結合在同一個產品裡。 ETL :Script DataBase :QVD DashBoard & OLAP & Reporting:在Sheet上的ObjectChart

ETL的處理說明 Click 進入Edit Script,所有的資料來源(資料庫的指定、各類型檔案的路徑)、檔案的讀取、檔案的合併、條件的判斷、QVD的產生…均在此Edit Script裡設定。

二、ETL的關聯說明 Join Sheet1原始資料 Sheet2原始資料 客戶 銷售 A 100 B 200 C 300 D G 客戶 性別 B 男 C 女 E F

ETL的關聯說明 Edit Script 如下:

ETL的關聯說明 QlikView 會自動依相同欄位名稱作關聯。

ETL的關聯說明 Sheet1 & Sheet2 同上, Left Join Edit Script 如下:

ETL的關聯說明 Left Join是以Sheet1為主。

ETL的關聯說明 Sheet1 & Sheet2 同上,Right Join Edit Script 如下:

ETL的關聯說明 Right Join是以Sheet2為主。

ETL的關聯說明 Sheet1 & Sheet2 同上,Concatenate 強制合併 Edit Script 如下:

ETL的關聯說明 Concatenate 是依Sheet1 和 Sheet2的筆數加總。

ETL的關聯說明 Inline 內崁表

ETL的關聯說明 Exists 資料過濾 Sheet1原始資料 Sheet2原始資料 A B 1 AAA 2 BBB 3 CCC 4 DDD 5 EEE 6 FFF A1 C 1 A 2 B 3 4 D 5 E 6 F 7 G 8 H

ETL的關聯說明 Not exists Edit Script 如下:

ETL的關聯說明 Not Exists(A,A1) 是A1 不存在A,只剩下7、8兩筆資料。

ETL的關聯說明 Crosstable 旋轉表 Sheet1原始資料

ETL的關聯說明 Crosstable 旋轉表 標準的Excel檔案,一般使用者會將資料彙總整理成容易 閱讀的格式,這在商用程式語言COBOL所設計的程式裡,時常有這種檔案格式,每筆Record 包含的欄位如下:庫別、料號及Occurs 12次的各月份庫存金額。但是這種非正規化的資料格式是不能用來作和年度月份有關的資料分析,我們必須想辦法將其一筆資料拆開成12筆資料,這樣QlikView才能Load進來作分析。

ETL的關聯說明 Crosstable 旋轉表 QlikView 有一個功能Crosstable可以將其拆解。

ETL的關聯說明 Crosstable 旋轉表 Crosstable(月份, 銷售金額,2) 2表示前面的二個欄位(BU、料號)為重複欄位每筆資料均要加上。月份為2009/Jan…,銷售金額為相對各月份之下的數值。

ETL的關聯說明 Crosstable 旋轉表 Reload 後按Ctrl+T,再按右鍵,按Preview。

ETL的關聯說明 Crosstable 旋轉表 以Straight Table來展示結果

ETL的關聯說明 QVD的產生 QVD 是QlikView存放資料的檔案,副檔名為.qvd。可以將Load 進來的資料再轉存至QVD,有需要時可以再從QVD Load 出來運用。有點像是QlikView 的資料庫。也可以當成是一個暫存檔,當有需要做一些較複雜的運算時,可以先存成QVD。

ETL的關聯說明 QVD的產生 同上Crosstable的例子,只需加入 Store TABLE1 into F_TABLE1.qvd(qvd);

ETL的關聯說明 QVD的產生 再Load 進來其檔案結構如下: LOAD BU, 料號, 月份, 銷貨金額 FROM F_TABLE1.qvd (qvd);  

ETL的關聯說明 QVD的產生

三、ETL的其他應用 用CONCATENATE來合併兩個Fact Table 兩個Fact Table :Orders Fact、Sales Fact 兩個Dimension Table :Country、Product

ETL的其他應用 要將Orders Fact、Sales Fact合併成一個Fact Table。

ETL的其他應用 用AutoNumber 來合併多個欄位,給合成一個Key。

ETL的其他應用 兩個Table 都有DEPARTMENT_NO、DEPARTMENT_TYPE_NO、COLLEGE_NO。如果不作任何處理QlikView 會自動產生複合鍵,複合鍵會使用很多記憶體資源,也會影響執行效率。

ETL的其他應用 將DEPARTMENT_NO、DEPARTMENT_TYPE_NO、COLLEGE_NO三個欄位用AutoNumber 組合起來形成一個單一的Key。其qvw變小 執行速度也變得更快。

ETL的其他應用 IF 指令 if (期初BMI >= L11 and 期初BMI <= L12, '1過輕',if (期初BMI >= L21 and 期初BMI <= L22, '2稍輕',if (期初BMI >= L31 and 期初BMI <= L32, '3適當',if (期初BMI >= L41 and 期初BMI <= L42, '4稍重','5過重')))) as 期初體重標準 將期初BMI依體重標準的定義來分為過輕、稍輕、適當、稍重及過重。

ETL的其他應用 消除關聯Loop 在資料庫Table設計時會有一種情況:Table1 中有一個Key 會Join到Table2,Table2中也有一個Key 會Join到Table3,而Table3中也有一個Key 會Join到Table1。如此Table1Table2Table3Table1,會形成Reference Loop。當使用者的程式用到此種狀況時,會造成無法正常執行,或者無法正常結束。

ETL的其他應用 消除關聯Loop QlikView BI可以載入不同的平台(AS/400、Unix、Linux、Windows…)中不同的資料格式(Oracle、Sybase、MS SQL、Access、Text File、QVD…),而載入的各個Table中,用欄位名稱相同的當作關聯的Key。使用者也可以在Edit Script去變更欄位的名稱,這會造成Reference Loop發生的風險。 當有二個以上的 Fact table,共用了二個以上的Dimension時,就會發生Reference Loop的現象。

ETL的其他應用 消除關聯Loop QlikView BI在按 時會去檢查是否發生Reference Loop。

ETL的其他應用 消除關聯Loop QlikView BI在按 時會去檢查是否發生Reference Loop。

ETL的其他應用 消除關聯Loop 下列是測試的五個Tale及所屬的欄位名稱。

ETL的其他應用 消除關聯Loop 下列是測試的五個Tale及所屬的欄位名稱。 Edit Script 如下: LOAD 日期, 訂單代號, 訂單說明 FROM loop2.xls (biff, embedded labels, table is order$);   LOAD 訂單序號, 產品代號, 單價 as 單價O, 金額 as 金額O (biff, embedded labels, table is order_detail$);

ETL的其他應用 消除關聯Loop LOAD 日期, 發票代號, 發票說明 FROM loop2.xls (biff, embedded labels, table is invoice$);   LOAD 發票序號, 產品代號, 單價, 金額 (biff, embedded labels, table is invoice_detail$);

ETL的其他應用 消除關聯Loop LOAD 產品代號, 產品名稱 FROM loop2.xls (biff, embedded labels, table is goods$);  Reload 後會產生如上畫面所說的Reference Loop,按Ctrl+T。

ETL的其他應用 消除關聯Loop 其中虛線為發生Loop的部份,需想辦法將其解決。消除Loop的思考方向是,想辦法切斷虛線的部份。切斷任意一條虛線,便可消除Reference Loop。 消除Reference Loop的方法: 1.修改欄位名稱,強行切斷關聯 2.移動欄位,消除關聯

ETL的其他應用 消除關聯Loop 我們只介紹修改欄位名稱。order和invoice之間,是依靠日期相關聯的,invoice的date修改名稱發票日期為則Reference Loop便可切斷。 LOAD 日期 as 發票日期, 發票代號, 發票說明 FROM loop2.xls (biff, embedded labels, table is invoice$);  

ETL的其他應用 消除關聯Loop 重新 後Reference Loop的情況已消失。

Q&A