資料探勘工具 - Splunk介紹報告者：曾彥志報告日期：2015/09/18.

Slides:

Advertisements

Similar presentations

第七組古文閱讀報告組長：秀惠組員：孟筑、雅曼、雅文、盈蓁. 《朱買臣苦學有成》之原文翻譯朱買臣，字翁子，吳人也。朱買臣，字翁子，吳國人。家貧，好讀書，不治產業，常刈（一ˋ）薪樵，賣以給（ㄐㄧ ˇ ）食。家裡雖然很窮困，但是他還是很喜歡讀書，因不懂得如何治理產業，只能靠著上山砍材去城.

Advertisements

西南政法大学图书馆江波重庆. 传统图书馆自动化图书馆复合图书馆数字图书馆  图书馆为图书流通服务所制定的相关规则，包括图书流通类型、读者类型、读者可借阅图书数量、可借阅时间、可续借时间、可续借次数、可预约数量等。

你不知道的 3M P 班級 : 創意二甲指導老師 : 袁又華組長 : 林毓茹組員 : 林以軒林欣汝陳盈羽陳怡如劉玉婷.

AWS 公有云服务. Amazon Web Service 简介 AWS 是向最终用户交付计算资源、保存数据和其他应用程序的一种最经济划算的方式，开发人员只需要按使用量付费，无需前期资本支出。利用 AWS ，开发人员可以轻松购买计算、存储、数据库和其他基于 Internet 的服务来支持其应用程序，以及灵活选择任何开发平台或编程环境。

开始周海 2012 级中软定制专业方向说明. 三个方向 Java 与移动互联.NET 软件开发嵌入式开发.

1 网站设计理念大连理工大学创新实验学院优秀网站展示 - LAMP 类网站

课程介绍（PPT版本号：2016年1月24日版本）温馨提示：编辑幻灯片母版，可以修改每页PPT的厦大校徽和底部文字林子雨

Amazon 云计算 AWS (三) 云计算（第三版）第 3 章 CLOUD COMPUTING Third Edition

電子商務：數位時代商機‧梁定澎總編輯‧前程文化出版

社會福利績效實地考核結果檢討性侵害加害人處遇業務

五所交大是一家演讲：孔谐和尹天威.

Big Data Ecosystem – Hadoop Distribution

清华大学罗念龙 2004年6月集成学生系统清华大学罗念龙 2004年6月.

美联软通国际通信业务介绍北京美联软通科技有限公司 2013年7月.

雷曼的滑铁卢 ——雷曼兄弟破产案例分析.

民主國家的政府體制我國的中央政府體制我國中央政府的功能地方政府組織與功能

美联软通短信平台解决方案北京美联软通科技有限公司 2013年7月.

內部控制教育宣導國科會計畫經費結報講習會-基礎班

傳統武術的本質與內涵 M111甲孝班張天瑋指導教授：李開濟博士.

OpenStack开源虚拟化平台(三) 云计算（第三版）第 8 章 CLOUD COMPUTING Third Edition

經費結報認證制度種子人員講習會主辦:汪憶芳協辦:陳蓮萍鄭曉雲江一帆日期:2012/09/04(二) 時間:09:00~12:15

E-Mapreduce培训系列基本介绍.

鞘翅目生科四乙蘇俊融.

云智慧助力在线医疗服务性能优化 —让IT运营更简单 2015年4月云智慧科技（北京）有限公司.

速收简历速收简历移动APP项目速收简历团队.

峰信电话管理系统产品介绍上海艾家电子商务有限公司 2011年7月.

云计算学习报告报告人: 陈霁大规模数据处理软件Apache Hadoop.

山东省水生态文明城市创建工作联席会议办公室

第35届北京青少年科技创新大赛网上申报北京青少年科技中心 2014年12月8日李佳熹.

身心障礙學生之升學與就業人發郭峻如科技吳心昀

国外市场（亚马逊）.

監察院公職人員財產申報處編製報告人:林世忠

《大数据技术原理与应用》课程介绍（2016春季学期）

認識食品標示營養師李曼瑄定緁食品有限公司

第11章海量信息存储主讲：刘方明副教授华中科技大学计算机学院

103年度雙和分區總務實務研討會經費申撥與核銷流程說明永續環境教育科-馮紹華 103年4月30日.

發展東華特色課程期末成果發表呂進瑞國立東華大學財金系.

医学人文折翼的天使不会飞谈晓文

核心价值观记心中主题班会

第一部分系统概述第二部分技术背景目录第三部分维修流程描述成功案例第四部分. 第一部分系统概述第二部分技术背景目录第三部分维修流程描述成功案例第四部分.

科學科污染空氣成因的：題目及減少空氣污染的方法陳玉玲 (4) 姓名：去到目錄.

苏州大汇信息科技有限公司招聘简介.

抗菌药物临床应用管理仁爱和谐敬业进取.

基于hadoop与hive的大数据分析体系构建

职团客户促销活动 2018年04月.

分布式系统中的关键概念及Hadoop的起源、架构、搭建

網路安全技術期末報告 Proxy Server

开源云计算系统简介电子工业出版社刘鹏主编《云计算》教材配套课件11.

Cloud Computing(雲端運算) 技術的現況與應用

斯巴達帶大家上雲端.

Hadoop平台與應用規劃實作報告者：劉育維.

Cloud (AWS) 產品放置 ex.巴士, 球場, 旅館 …. 客戶需求SW模組化 1.客製化需求 2.Web技術

Haiwell Cloud 海为云介绍.

基于大数据的物流资源整合福建师范大学协和学院沈庆琼.

Homework 1(上交时间：10月14号) 倒排索引.

软件工程基础云计算概论刘驰.

大数据介绍及应用案例分享 2016年7月华信咨询设计研究院有限公司.

国际经济贸易学院 2015暑期社会实践活动总结本期亮点.

学做统一清香四溢两学一做学习教育总结汇报 ——第七党总支刘红平.

职团客户促销活动 2018年01月.

基于大数据平台数据管理研究何家乐 2013年7月中国科学院高能物理研究所.

雲端運算的基石(6) 雲端運算與虛擬化技術

校務資訊系統發展進度控管月會系統發展組 2018/03/29.

职团客户促销活动 2018年03月.

年所得12万以上自行纳税申报信息管理科张沛.

科系：休閒事業管理系. 指導老師：許興家老師. 組員：游海欽.周書豪.林季蓁.

本院使用建教合作之台北醫學大學圖書館資料庫設定方式說明

醫學美學期末報告醫學美學之我見---- 談單眼皮變雙眼皮

技專校院多元入學管道國立臺北科技大學教務處涂雅筑.

大数据应用人才培养系列教材数据挖掘基础刘鹏张燕总主编陶建辉主编姜才康副主编.

Presentation transcript:

資料探勘工具 - Splunk介紹報告者：曾彥志報告日期：2015/09/18

目錄 Splunk是什麼? 什麼機器資料? 機器資料的來源 Splunk的版本 Hunk®：Splunk Analytics for Hadoop Hunk® 導覽 Hunk® 6.2新功能

Splunk是什麼? Splunk 是專門設計用於處理機器資料的平台。 IT人員可以透過瀏覽器針對企業的各種機器資料進行關鍵字搜尋，快速獲得所需要的關鍵資料，然後透過 Splunk 將搜尋所得的結果立即做運算處理，來產生各種報告、圖表與警示。 Splunk 還可以設定進行排程定時搜尋，並將結果以 Email 或簡訊等方式通知相關人員。它會收集您所有 IT 系統和基礎結構(實體、虛擬以及在雲端中)所產生的機器資料，並編製索引加以利用。不必耗時費日，即可在幾分鐘內解決問題和偵測安全事件。監視點對點基礎結構，以避免服務效能降低或中斷。以較低成本符合法規遵循要求。聯繫並分析跨越多個系統的多重事件。

什麼是機器資料? 機器資料包含客戶、使用者、交易、應用程式、伺服器、網路以及行動裝置之所有活動與行為的記錄。也包含設定、API 中的資料、訊息佇列、變更事件、診斷命令的輸出、通聯記錄與產業系統中的感應器資料等。

機器資料的來源(1/4) 資料類型何處尋找能告訴您什麼應用程式記錄本機記錄檔、log4j、log4ne、Weblogic、WebSphere、JBoss、.NET、PHP 使用者活動、詐騙偵測、應用程式效能商業程序記錄商業程序管理記錄跨通路、購買、帳戶變更、問題報告的客戶活動通聯記錄電信業者與網路交換器所記錄的通聯記錄 (CDR)、收費資料記錄、事件資料記錄計費、收益保證、客戶保證、合作夥伴結算、行銷情報點擊流記錄 Web 伺服器、路由器、Proxy 伺服器、廣告伺服器可用性分析、數位行銷與一般研究設定檔系統設定檔基礎結構如何設定、偵錯失敗、後門攻擊、定時炸彈

機器資料的來源(2/4) 資料類型何處尋找能告訴您什麼資料庫稽核記錄資料庫記錄檔、稽核表格如何隨時間修改資料庫資料，以及誰進行了這些變更檔案系統稽核記錄儲存在共用檔案系統中的敏感資料監控與稽核敏感資料的讀取存取權管理與記錄 API 檢查點防火牆會透過 OPSEC Log Export API (OPSEC LEA) 以及 VMware 與 Citrix 中的其他廠商特定 API 記錄管理資料與記錄事件訊息佇列 JMS、RabbitMQ 與 AquaLogic 複雜應用程式中的偵錯問題，且作為為應用程式記錄架構的骨幹使用

機器資料的來源(3/4) 資料類型何處尋找能告訴您什麼封包/流量資料 tcpdump 與 tcpflow，這會產生 pcap 或流量資料以及其他實用封包層級與工作階段層級資訊效能降低、逾時、瓶頸或指出網路可能會遭受威脅或遠端攻擊目標的可疑活動 SCADA 資料監督控制與資料擷取 (SCADA) 識別 SCADA 基礎結構中的趨勢、模式與異常情況，也可用於驅動客戶價值感應器資料會根據監控環境條件 (例如溫度、聲音、壓力、動力、水量等) 產生資料的感應器裝置水量監控、機器運作情況監控與情報型家庭監控系統記錄您的路由器、切換器與網路裝置中的系統記錄疑難排解、分析、資訊安全稽核

機器資料的來源(4/4) 資料類型何處尋找能告訴您什麼 Web 存取記錄 Web 存取記錄會報告由 Web 伺服器處理的每個要求 Web Proxy 記錄 Web Proxy 會記錄使用者透過 Proxy 做出的每一個 Web 要求監控及調查服務條款與資料洩漏事件 Windows 事件 Windows 應用程式、資訊安全與系統事件記錄偵測業務關鍵的應用程式、安全性資訊與使用模式的問題。線路傳輸數據 DNS 查閱及記錄、含標頭的通訊協定層級資訊、內容與流量記錄主動監控應用程式的效能與可用性、使用者體驗、事件調查、網路、威脅偵測、監控與法規遵循

Splunk的版本 Splunk® Enterprise Splunk Cloud Splunk Light Hunk® ：Splunk Analytics for Hadoop Splunk MINT™ Splunk App for Enterprise Security Splunk App for Stream

Hunk® Hunk 是一個巨量資料分析平台，能在 Hadoop 及 NoSQL 資料存放區中快速探索、分析及視覺化資料。 Hunk 需在64位元的 Linux 上執行。 Hunk 可將 NoSQL 與 Apache Accumulo、Apache Cassandra、Couchbase、MongoDB 及 Neo4j 等資料存放區中的資料進行串流，以探索與分析巨量資料架構間的資料。

Hunk® 導覽(1/12) 互動式搜尋 Hunk 的結構描述可快速提供針對 Hadoop 資料執行查詢的彈性。可用於 Apache Hadoop 大多數商業化的主要預設套裝平台，包括Cloudera、Hortonworks、IBM、MapR 和 Pivotal，且可支援第一代的 MapReduce 和 YARN。

Hunk® 導覽(2/12) 圖1、互動式搜尋

Hunk® 導覽(3/12) 立即預覽結果在 Hunk 執行查詢時，它會立即串流回過渡期結果，同時MapReduce 工作會繼續在背景中執行。提供更快速、互動程度更高的體驗，也可以暫停並縮小查詢範圍，無須等候完整的 MapReduce 工作完成。

Hunk® 導覽(4/12) 圖2、立即預覽結果

Hunk® 導覽(5/12) 分析原始資料 Hunk 可以分析 Hadoop 及 NoSQL 資料存放區中的原始資料，透過「資料模型」描述基本原始資料的關係，使資料更具意義並提升可用性。使用樞紐分析介面快速產生圖表、視覺化內容與儀表板。

Hunk® 導覽(6/12) 圖3、分析原始資料

Hunk® 導覽(7/12) 編輯儀表板與檢視儀表板編輯器可以建立與編輯、整合多種圖表與檢視的儀表板，以滿足眾多業務單位和IT人員的需求。甚至可以將圖表及儀表板嵌入第三方商務應用程式。

Hunk® 導覽(8/12) 圖4、編輯儀表板與檢視

Hunk® 導覽(9/12) 豐富的開發環境 Hunk 包含了標準的網站架構、呼叫 REST API 及利用C#、Java、JavaScript、Python、PHP 與 Ruby 的軟體開發套件。串流資源資料庫讓開發人員能夠從 NoSQL 及 Apache Accumulo、Apache Cassandra、MongoDB 與 Neo4j 等其他資料存放區串流資料，以便在 Hunk 中進行探索、分析與視覺化。

Hunk® 導覽(10/12) 圖5、豐富的開發環境

Hunk® 導覽(11/12) Splunk虛擬索引技術可將 Splunk 儲存層從資料存取層和分析層解耦分離，以便 Hunk 將要求通透地派送至不同的資料存放節點。 Splunk 搜尋處理語言 (SPLTM) 可提供分析層在各種大型資料集中取得互動式資料探索。

Hunk® 導覽(12/12) 圖6、Splunk虛擬索引技術

Hunk®6.2新功能(1/3) 與 Amazon EMR 整合：直接從 Amazon EMR 主控台，以 Amazon EMR 與 S3 的每小時資料定價來自動利用 AWS 提供的已設定 Hunk 執行個體。 Hunk 應用套件：透過預先包裝的連線 (包括 MongoDB 版 Hunk 應用套件與 Hunk 版 Sqrrl 應用套件 (Apache Accumulo))搜尋、分析與視覺化 NoSQL 及其他資料存放區中的資料。

Hunk®6.2新功能(2/3) Splunk Enterprise 的封存：將 Splunk Enterprise 中的歷史資料封存至 HDFS 與 Amazon S3 上的商品存放區。利用聯合查詢將來自 Splunk Enterprise 的即時資料與 Hunk 中的歷史資料相關聯。 Hunk Sandbox：逐步教學與範例儀表板，讓您可以快速瞭解 Hunk 互動式搜尋與分析，而無須設定 Hadoop 叢集。

Hunk®6.2新功能(3/3) Data Explorer：視覺化精靈可讓您瀏覽並選取相關資料集，並為 Hadoop 中的分析準備原始資料。事件模型偵測：透過自動分組類似事件來探索基礎資料中具意義的模式，以加快分析速度。

謝謝各位耐心地聆聽 THANKS FOR YOUR LISTENING.