資料探勘工具 - Splunk介紹 報告者:曾彥志 報告日期:2015/09/18.

Slides:



Advertisements
Similar presentations
第七組古文閱讀報告 組長:秀惠 組員:孟筑、雅曼、雅文、盈蓁. 《朱買臣苦學有成》之原文翻譯 朱買臣,字翁子,吳人也。 朱買臣,字翁子,吳國人。 家貧,好讀書,不治產業,常刈(一ˋ)薪 樵,賣以給 (ㄐㄧ ˇ ) 食。 家裡雖然很窮困,但是他還是很喜歡讀書,因 不懂得如何治理產業,只能靠著上山砍材去城.
Advertisements

西南政法大学图书馆 江波 重庆. 传统图书馆自动化图书馆复合图书馆数字图书馆  图书馆为图书流通服务所制定的相关规则,包 括图书流通类型、读者类型、读者可借阅图书 数量、可借阅时间、可续借时间、可续借次数、 可预约数量等。
你不知道的 3M P 班級 : 創意二甲 指導老師 : 袁又華 組長 : 林毓茹 組員 : 林以軒 林欣汝 陳盈羽 陳怡如 劉玉婷.
AWS 公有云服务. Amazon Web Service 简介 AWS 是向最终用户交付计算资源、保存数据和其他应用程序的一种最经济划算的方式,开发人员只需要按使用量付费,无需前期资本支出。利用 AWS ,开发人员可以轻松购买计算、存储、数据库和其他基于 Internet 的服务来支持其应用程序,以及灵活选择任何开发平台或编程环境。
开始 周海 2012 级中软定制专业方向说明. 三个方向 Java 与移动互联.NET 软件开发 嵌入式开发.
1 网站设计理念 大连理工大学创新实验学院 优秀网站展示 - LAMP 类网站
课程介绍 (PPT版本号:2016年1月24日版本) 温馨提示:编辑幻灯片母版,可以修改每页PPT的厦大校徽和底部文字 林子雨
Amazon 云计算 AWS (三) 云计算 (第三版) 第 3 章 CLOUD COMPUTING Third Edition
電子商務:數位時代商機‧梁定澎總編輯‧前程文化 出版
社會福利績效實地考核結果檢討 性侵害加害人處遇業務
五所交大是一家 演讲: 孔谐和 尹天威.
Big Data Ecosystem – Hadoop Distribution
清华大学 罗念龙 2004年6月 集成学生系统 清华大学 罗念龙 2004年6月.
美联软通国际通信业务介绍 北京美联软通科技有限公司 2013年7月.
雷 曼 的 滑 铁 卢 ——雷曼兄弟破产案例分析.
民主國家的政府體制 我國的中央政府體制 我國中央政府的功能 地方政府組織與功能
美联软通短信平台解决方案 北京美联软通科技有限公司 2013年7月.
內部控制教育宣導 國科會計畫經費結報講習會-基礎班
傳統武術的本質與內涵 M111甲孝班張天瑋 指導教授:李開濟博士.
OpenStack开源虚拟化平台(三) 云计算 (第三版) 第 8 章 CLOUD COMPUTING Third Edition
經費結報認證制度 種子人員講習會 主辦:汪憶芳 協辦:陳蓮萍 鄭曉雲 江一帆 日期:2012/09/04(二) 時間:09:00~12:15
E-Mapreduce培训系列 基本介绍.
鞘翅目 生科四乙 蘇俊融.
云智慧助力在线医疗服务性能优化 —让IT运营更简单 2015年4月 云智慧科技(北京)有限公司.
速收简历 速收简历移动APP项目 速收简历团队.
峰信 电话管理系统 产品介绍 上海艾家电子商务有限公司 2011年7月.
云计算学习报告 报告人: 陈 霁 大规模数据处理软件Apache Hadoop.
山东省水生态文明城市创建工作联席会议办公室
第35届北京青少年科技创新大赛 网上申报 北京青少年科技中心 2014年12月8日 李佳熹.
身心障礙學生之升學與就業 人發 郭峻如 科技 吳心昀
国外市场(亚马逊).
監察院公職人員財產申報處 編製 報告人:林世忠
《大数据技术原理与应用》 课程介绍 (2016春季学期)
認識食品標示 營養師 李曼瑄 定緁食品有限公司
第11章 海量信息存储 主讲:刘方明 副教授 华中科技大学计算机学院
103年度雙和分區總務實務研討會 經費申撥 與 核銷流程說明 永續環境教育科-馮紹華 103年4月30日.
發展東華特色課程 期末成果發表 呂進瑞 國立東華大學財金系.
医学人文 折翼的天使不会飞 谈晓文
核心价值观记心中 主题班会
第一部分 系统概述 第二部分 技术背景 目录 第三部分 维修流程描述 成功案例 第四部分. 第一部分 系统概述 第二部分 技术背景 目录 第三部分 维修流程描述 成功案例 第四部分.
科學科 污染 空氣 成因 的 : 題目 及 減少空氣污染的方法 陳玉玲 (4) 姓名 : 去到目錄.
苏州大汇信息科技有限公司 招聘简介.
抗菌药物临床应用管理 仁爱 和谐 敬业 进取.
基于hadoop与hive的大数据分析体系构建
职团客户促销活动 2018年04月.
分布式系统中的关键概念及Hadoop的起源、架构、搭建
網路安全技術期末報告 Proxy Server
开源云计算系统简介 电子工业出版社 刘鹏主编《云计算》教材配套课件11.
Cloud Computing(雲端運算) 技術的現況與應用
斯巴達帶大家上雲端.
Hadoop平台與應用規劃實作 報告者:劉育維.
Cloud (AWS) 產品放置 ex.巴士, 球場, 旅館 …. 客戶需求SW模組化 1.客製化需求 2.Web技術
Haiwell Cloud 海为云介绍.
基于大数据的物流资源整合 福建师范大学协和学院 沈庆琼.
Homework 1(上交时间:10月14号) 倒排索引.
软件工程基础 云计算概论 刘 驰.
大数据介绍及应用案例分享 2016年7月 华信咨询设计研究院有限公司.
国际经济贸易学院 2015暑期 社会实践活动总结 本期亮点.
学做统一 清香四溢 两学一做学习教育总结汇报 ——第七党总支 刘红平.
职团客户促销活动 2018年01月.
基于大数据平台数据管理研究 何家乐 2013年7月 中国科学院高能物理研究所.
雲端運算的基石(6) 雲端運算與虛擬化技術
校務資訊系統 發展進度控管月會 系統發展組 2018/03/29.
职团客户促销活动 2018年03月.
年所得12万以上自行纳税申报 信息管理科 张沛.
科 系:休閒事業管理系. 指導老師:許興家老師. 組 員:游海欽.周書豪.林季蓁.
本院使用建教合作之台北醫學大學 圖書館資料庫設定方式說明
醫學美學期末報告 醫學美學之我見---- 談單眼皮變雙眼皮
技專校院多元入學管道 國立臺北科技大學 教務處 涂雅筑.
大数据应用人才培养系列教材 数据挖掘基础 刘 鹏 张 燕 总主编 陶建辉 主编 姜才康 副主编.
Presentation transcript:

資料探勘工具 - Splunk介紹 報告者:曾彥志 報告日期:2015/09/18

目錄 Splunk是什麼? 什麼機器資料? 機器資料的來源 Splunk的版本 Hunk®:Splunk Analytics for Hadoop Hunk® 導覽 Hunk® 6.2新功能

Splunk是什麼? Splunk 是專門設計用於處理機器資料的平台。 IT人員可以透過瀏覽器針對企業的各種機器資料進行關鍵字搜尋,快速獲得所需要的關鍵資料,然後透過 Splunk 將搜尋所得的結果立即做運算處理,來產生各種報告、圖表與警示。 Splunk 還可以設定進行排程定時搜尋,並將結果以 Email 或簡訊等方式通知相關人員。 它會收集您所有 IT 系統和基礎結構(實體、虛擬以及在雲端中)所產生的機器資料,並編製索引加以利用。 不必耗時費日,即可在幾分鐘內解決問題和偵測安全事件。監視點對點基礎結構,以避免服務效能降低或中斷。以較低成本符合法規遵循要求。聯繫並分析跨越多個系統的多重事件。

什麼是機器資料? 機器資料包含客戶、使用者、交易、應用程式、伺服器、網路以及行動裝置之所有活動與行為的記錄。 也包含設定、API 中的資料、訊息佇列、變更事件、診斷命令的輸出、通聯記錄與產業系統中的感應器資料等。

機器資料的來源(1/4) 資料類型 何處尋找 能告訴您什麼 應用程式記錄 本機記錄檔、log4j、log4ne、Weblogic、WebSphere、JBoss、.NET、PHP 使用者活動、詐騙偵測、應用程式效能 商業程序記錄 商業程序管理記錄 跨通路、購買、帳戶變更、問題報告的客戶活動 通聯記錄 電信業者與網路交換器所記錄的通聯記錄 (CDR)、收費資料記錄、事件資料記錄 計費、收益保證、客戶保證、合作夥伴結算、行銷情報 點擊流記錄 Web 伺服器、路由器、Proxy 伺服器、廣告伺服器 可用性分析、數位行銷與一般研究 設定檔 系統設定檔 基礎結構如何設定、偵錯失敗、後門攻擊、定時炸彈

機器資料的來源(2/4) 資料類型 何處尋找 能告訴您什麼 資料庫稽核記錄 資料庫記錄檔、稽核表格 如何隨時間修改資料庫資料,以及誰進行了這些變更 檔案系統稽核記錄 儲存在共用檔案系統中的敏感資料 監控與稽核敏感資料的讀取存取權 管理與記錄 API 檢查點防火牆會透過 OPSEC Log Export API (OPSEC LEA) 以及 VMware 與 Citrix 中的其他廠商特定 API 記錄 管理資料與記錄事件 訊息佇列 JMS、RabbitMQ 與 AquaLogic 複雜應用程式中的偵錯問題,且作為為應用程式記錄架構的骨幹使用

機器資料的來源(3/4) 資料類型 何處尋找 能告訴您什麼 封包/流量資料 tcpdump 與 tcpflow,這會產生 pcap 或流量資料以及其他實用封包層級與工作階段層級資訊 效能降低、逾時、瓶頸或指出網路可能會遭受威脅或遠端攻擊目標的可疑活動 SCADA 資料 監督控制與資料擷取 (SCADA) 識別 SCADA 基礎結構中的趨勢、模式與異常情況,也可用於驅動客戶價值 感應器資料 會根據監控環境條件 (例如溫度、聲音、壓力、動力、水量等) 產生資料的感應器裝置 水量監控、機器運作情況監控與情報型家庭監控 系統記錄 您的路由器、切換器與網路裝置中的系統記錄 疑難排解、分析、資訊安全稽核

機器資料的來源(4/4) 資料類型 何處尋找 能告訴您什麼 Web 存取記錄 Web 存取記錄會報告由 Web 伺服器處理的每個要求 Web Proxy 記錄 Web Proxy 會記錄使用者透過 Proxy 做出的每一個 Web 要求 監控及調查服務條款與資料洩漏事件 Windows 事件 Windows 應用程式、資訊安全與系統事件記錄 偵測業務關鍵的應用程式、安全性資訊與使用模式的問題。 線路傳輸數據 DNS 查閱及記錄、含標頭的通訊協定層級資訊、內容與流量記錄 主動監控應用程式的效能與可用性、使用者體驗、事件調查、網路、威脅偵測、監控與法規遵循

Splunk的版本 Splunk® Enterprise Splunk Cloud Splunk Light Hunk® :Splunk Analytics for Hadoop Splunk MINT™ Splunk App for Enterprise Security Splunk App for Stream

Hunk® Hunk 是一個巨量資料分析平台,能在 Hadoop 及 NoSQL 資料存放區中快速探索、分析及視覺化資料。 Hunk 需在64位元的 Linux 上執行。 Hunk 可將 NoSQL 與 Apache Accumulo、Apache Cassandra、Couchbase、MongoDB 及 Neo4j 等資料存放區中的資料進行串流,以探索與分析巨量資料架構間的資料。

Hunk® 導覽(1/12) 互動式搜尋 Hunk 的結構描述可快速提供針對 Hadoop 資料執行查詢的彈性。 可用於 Apache Hadoop 大多數商業化的主要預設套裝平台,包括Cloudera、Hortonworks、IBM、MapR 和 Pivotal,且可支援第一代的 MapReduce 和 YARN。

Hunk® 導覽(2/12) 圖1、互動式搜尋

Hunk® 導覽(3/12) 立即預覽結果 在 Hunk 執行查詢時,它會立即串流回過渡期結果,同時MapReduce 工作會繼續在背景中執行。 提供更快速、互動程度更高的體驗,也可以暫停並縮小查詢範圍,無須等候完整的 MapReduce 工作完成。

Hunk® 導覽(4/12) 圖2、立即預覽結果

Hunk® 導覽(5/12) 分析原始資料 Hunk 可以分析 Hadoop 及 NoSQL 資料存放區中的原始資料,透過「資料模型」描述基本原始資料的關係,使資料更具意義並提升可用性。 使用樞紐分析介面快速產生圖表、視覺化內容與儀表板。

Hunk® 導覽(6/12) 圖3、分析原始資料

Hunk® 導覽(7/12) 編輯儀表板與檢視 儀表板編輯器可以建立與編輯、整合多種圖表與檢視的儀表板,以滿足眾多業務單位和IT人員的需求。 甚至可以將圖表及儀表板嵌入第三方商務應用程式。

Hunk® 導覽(8/12) 圖4、編輯儀表板與檢視

Hunk® 導覽(9/12) 豐富的開發環境 Hunk 包含了標準的網站架構、呼叫 REST API 及利用C#、Java、JavaScript、Python、PHP 與 Ruby 的軟體開發套件。 串流資源資料庫讓開發人員能夠從 NoSQL 及 Apache Accumulo、Apache Cassandra、MongoDB 與 Neo4j 等其他資料存放區串流資料,以便在 Hunk 中進行探索、分析與視覺化。

Hunk® 導覽(10/12) 圖5、豐富的開發環境

Hunk® 導覽(11/12) Splunk虛擬索引技術 可將 Splunk 儲存層從資料存取層和分析層解耦分離,以便 Hunk 將要求通透地派送至不同的資料存放節點。 Splunk 搜尋處理語言 (SPLTM) 可提供分析層在各種大型資料集中取得互動式資料探索。

Hunk® 導覽(12/12) 圖6、Splunk虛擬索引技術

Hunk®6.2新功能(1/3) 與 Amazon EMR 整合: 直接從 Amazon EMR 主控台,以 Amazon EMR 與 S3 的每小時資料定價來自動利用 AWS 提供的已設定 Hunk 執行個體。 Hunk 應用套件: 透過預先包裝的連線 (包括 MongoDB 版 Hunk 應用套件與 Hunk 版 Sqrrl 應用套件 (Apache Accumulo))搜尋、分析與視覺化 NoSQL 及其他資料存放區中的資料。

Hunk®6.2新功能(2/3) Splunk Enterprise 的封存: 將 Splunk Enterprise 中的歷史資料封存至 HDFS 與 Amazon S3 上的商品存放區。利用聯合查詢將來自 Splunk Enterprise 的即時資料與 Hunk 中的歷史資料相關聯。 Hunk Sandbox: 逐步教學與範例儀表板,讓您可以快速瞭解 Hunk 互動式搜尋與分析,而無須設定 Hadoop 叢集。

Hunk®6.2新功能(3/3) Data Explorer: 視覺化精靈可讓您瀏覽並選取相關資料集,並為 Hadoop 中的分析準備原始資料。 事件模型偵測: 透過自動分組類似事件來探索基礎資料中具意義的模式,以加快分析速度。

謝謝各位耐心地聆聽 THANKS FOR YOUR LISTENING.