怎样规划部署您的大数据应用系统 大数据厂商联盟 李 永 18888852302 VoltDB基础 概念与架构 1.

Slides:



Advertisements
Similar presentations
管理科学与工程类专业 职业规划问题探讨 报告人 : 李增兵 67D103 , FTP : // 管理科学与工程学院.
Advertisements

顧客關係管理:整合雲端應用服務.陳美純著.前程文化 出版 第十三章 商業智慧在顧客關係管理 的應用 授課教師:
制造企业的数字化转型之路 2013年7月.
互联网金融之金融数据挖掘 邹永杰 江西财经大学金融学院.
北京咱爸咱妈养老投资管理有限公司大庆分公司
顧客關係管理 復御管理股份有限公司 王復蘇醫師 編著 書籍編號:A1-03.
Big Data Ecosystem – Hadoop Distribution
劳动关系法务-实操篇 规章制度修审与员工手册撰写.
毛峰教授 北京师范大学教授,博士生导师 国家社科基金项目专家 北京华文教育顾问
优质护理的指导思想  以科学发展观为指导,贯彻落实《2011年公立医院改革试点工作安排》关于“推广优质护理服务”的部署和要求,结合全国卫生系统创先争优活动和“服务好、质量好、医德好,群众满意”的“三好一满意”活动,深化“以病人为中心”的服务理念,紧紧围绕“改革护理模式,履行护理职责,提供优质服务,提高护理水平”的工作宗旨,充分调动临床一线广大护士工作的积极性,按照《医院实施优质护理服务工作标准(试行)》,为人民群众提供全程、全面、优质的护理服务,保障医疗安全,改善患者体验,促进医患和谐。
Alibaba’s Practice on Data Security Kathy Pan Alibaba Data Economy Research Center Alibaba Research Institute.
标题 主讲: 时间:.
“大云”大数据平台及应用 中国移动通信研究院 郭磊涛 2013年11月.
METAEDGE Corporation Taiwan
顏協邦 慧盟資訊 商業智慧導入服務部 資深經理
內湖高工講綱 Career雜誌總編輯 臧聲遠.
长江大学电视台大会交流发言.
云计算突飞猛进.
PB级科研数据集的管理和应用 曙光信息产业(北京)有限公司.
国家公共文化服务体系建设 专家委员会 委员 冯 守 仁
共产党员致力 新疆油田信息化建设 数据公司信息业务党支部 2013年6月.
云计算业务应用-数据挖掘.
直面挑战 亦危亦机 神州数码管理系统有限公司 张振清.
93年度發展學校重點特色專案補助計畫 建構e時代流通產業整合性教學平台
探討旅遊業之行銷策略-以雄獅旅行社為例 210。60914。巫怡樺 210。60916。季瑞珠 210。50816。吳聖貞
<<Oracle DBA工厂-Oracle从入门到精通>>全套视频教程(一)之 安装部署 讲师:黄利强 QQ:
第 一 章 資訊系統開發概論 課程名稱:系統分析與設計 各位同學大家好,我是李春雄老師,本學期所開設的課程名稱為「資料結構」,
2 职业生涯与人生 梦想 寻找适合自己的道路 1) 职业生涯的含义:
講者:洪有義教授 時間: 地點:國立馬公高中崇正堂
發展東華特色課程 期末成果發表 呂進瑞 國立東華大學財金系.
校務研究能量建立與 在校務上的應用 中原大學機械系 許政行 教授 日期:105年8月25日.
一 二 三 四 五 六 七 项目建设总体情况 建设工作机制与举措 项目建设进展 建设经费投入与使用 贡献与示范 典型案例
大数据在医疗行业的应用.
Azure Event Hub Survey 周琦.
中央大學、資訊管理系 范錚強 updated
資料探勘工具 - Splunk介紹 報告者:曾彥志 報告日期:2015/09/18.
世新大學 陳育亮 Ch13 從ERP到企業E化 世新大學 陳育亮
数据仓库和数据挖掘 DATA WAREHOUSING AND DATA MINING 经济科学室验室
第 1 章 ERP的演变.
Chap 1:企業資源規劃簡介 ERP的定義與沿革 企業為何使用ERP ERP導入 以ERP為基礎的企業E化
從ERP到企業E化.
文字探勘與知識工程 Text Mining & Knowledge Engineering
基于大数据的物流资源整合 福建师范大学协和学院 沈庆琼.
CH.5 CRM的核心議題 與ERP、SCM及BI之整合應用
第一节 客户关系管理 1、客户关系管理的产生 2、客户关系管理的基本概念 3、客户关系管理的作用 4、CRM与ERP的关系
Data Mining 資料探勘 Introduction to Data Mining Min-Yuh Day 戴敏育
数据建模介绍.
大数据介绍及应用案例分享 2016年7月 华信咨询设计研究院有限公司.
K/3 Cloud V6.1产品培训 -- 经营分析平台
企業資源規劃簡介.
K/3 Cloud V6.0产品培训 -- 实施平台 K/3 Cloud 产品部
K/3 Cloud V6.0产品培训 -- s-HR集成
SAP R/3架構及前端軟體安裝 Logical View of the R/3 System SAP Frontend 6.2安裝
資料庫 靜宜大學資管系 楊子青.
某港务集团 信息化平台规划书粗稿.
K/3 Cloud V6.0产品培训 -- 业务监控 K/3 Cloud 产品部
K/3 Cloud V6.1产品培训 ---集成平台 K/3 Cloud产品部.
K/3 Cloud V6.0产品培训 ---集成平台 K/3 Cloud产品部.
K/3 Cloud V6.1产品培训 -- 业务监控 K/3 Cloud 产品部
網際網路版人力資源管理系統 (WebHR)
國民大學 國民大學.
交通大學 運輸科技與管理學系 博士班二年級 朱佑旌
TurboDX架构、应用场景、比较优势 北京数贝软件科技有限公司
求職防騙面面觀 不累生活文化有限公司 行政總監 賴永洲.
TinyDB資料庫 靜宜大學資管系 楊子青.
K/3 Cloud V6.0产品培训 --存货核算 K/3 Cloud产品部.
時間管理在SAP B1之應用 -如何準備個案 作者:蕭景陽 何亘翊 指導教授:陳武林 教授.
機構督導: 范盛翔 督導 實習生: 佛光大學社會學系江佳穎 實習日期: 7/1(二)~8/29(五)
上海理工大学 光电信息与计算机工程学院 数据仓库与数据挖掘 张 艳 上海理工大学 光电信息与计算机工程学院.
顧客關係管理介紹 班級:資管三德 姓名:樂書齊 學號:
Presentation transcript:

怎样规划部署您的大数据应用系统 大数据厂商联盟 李 永 18888852302 VoltDB基础 概念与架构 1

VoltDB基础 概念与架构

怎样用Connotate+VoltDB+Actian+Datameer发现13岁少女怀孕 内部静态历史交易数据 + (WEB数据+实时动态数据)融合

SecureAlert +Paraccel 位置数据实时分析-行动 抵御犯罪,保卫和平《少年派报告》 “预警人” SecureAlert +Paraccel

数据分析的需求 认知性分析 指令性分析 预测性分析 描述性分析 线性扩展 响应时间 数据量 内存 数据库 MPP Hadoop & RDB 秒级 MPP 分钟级 Hadoop & < 1小时 小时级 RDB < 微秒 100TB 10TB 1TB 100GB 响应时间 数据量 线性扩展 10PB 内存 计算 秒级 索引 技术 分钟级 执行 优化 < 1小时 高度 容错 小时级 VoltDB基础 概念与架构 5

数据的价值链 OLTP Hadoop 单个数据价值 整合数据价值 数据仓库 应用系统 BI DW 功能和性能的满足 1、大量的钱堆积起来的 快 复杂 大型 功能和性能的满足 1、大量的钱堆积起来的 2、修修补补糊起来的 单个数据价值 整合数据价值 OLTP 数据仓库 BI DW Hadoop 数据价值 应用系统 应用复杂度 慢 简单 小型 互动交互分析 实时分析 记录查询 历史数据分析 探索性数据分析 微秒 百分之几秒 几秒 几分钟 几小时 实时交易 实时精准广告 检验匹配 核准交易 数据流处理 计算风险 排行榜 集合整合 计算 检索点击 数据流Retrieve click 显示订单 试验算法 BI商业智能 数据中心 趋势预测分析 算法挖掘 日志分析 欺诈方式匹配

Exploratory Analytics 偶发高频数据与DW历史数据和Hadoop探索分析融合 Hadoop探索性分析 高频实时动态数据 Knowledge Hadoop, et al Data Sciences Exploratory logins sensors impressions orders authorizations clicks trades Raw Events Pre-processed Data 高频数据库VoltDB Make the most informed decision every time there is an interaction Data Warehouse Reports Long term trending Analysis 数据仓库 Ingest Events Decisioning Real-time Analytics 历史数据分析 Transactional Analytic Interactive Real-time Analytics Record Lookup Historical Analytics Exploratory Analytics 7

Exploratory Analytics 偶发高频数据的数据获取与处理 Recom-mendation User Mgt. Click Stream Personal-ization Hadoop Velocity OLTP logins sensors impressions orders authorizations clicks trades Analytic results enrich decision making ERP CRM HR Orders Cart Inv Data warehouse Traditional OLTP Velocity will sneak up on you – push downward through legacy database tiers and continue to affect more and more applications: BI, analytics, etc. Interactive Real-time Analytics Historical Analytics Exploratory Analytics 8

Exploratory Analytics 数据的存储运算 —数据库的选择 内存数据库 毫秒时效的保障 Fast Complex Large Value of Individual Data Item Aggregate Data Value Velocity (“New” OLTP) Hadoop, etc. NoSQL Application Complexity NewSQL Data Value Data Warehouse Traditional RDBMS Simple Slow Small Transactional Analytic Interactive Real-time Analytics Record Lookup Historical Analytics Exploratory Analytics

高频事件数据+留存历史数据---(实时+交互+互动)融合 偶发的高频事件+实时动态互动分析—行动 高频事件数据+留存历史数据---(实时+交互+互动)融合 web数据 储户静态历史交易数据 访问者储户身份和历史交易数据 实时动态数据、感应器、机器 监控、摄像头、交易、位置 通信通话、短信、交通 实时动态数据 WEB数据、微博微信、电子邮件 Cookies、点击行为、情感情绪 发帖投诉、动态的IP

大数据功能和应用解决方案 方案一、Hadoop部署+WEB数据抽取监控情报分析 方案二、Hadoop部署+企业原有应用系统查询分析 方案六、系统性能优化提高速度 方案七、WIFI(位置、点击行为)数据实时精准营销 方案八、高频交易数据实时营销 方案九、实时计费 方案十、网络流量分析 。。。。。。

方案一、Hadoop集群优化部署安全管理解决方案 推荐的部分大数据解决方案 方案一、Hadoop集群优化部署安全管理解决方案 方案二、大数据可视化分析解决方案 12

方案三、WEB数据自动抽取舆情情报分析解决方案 方案四、高频交易(实时计费、营销、流量)分析解决方案 13

方案六、优化数据中心和应用系统提高速度解决方案 方案五、升级构建大数据分析平台解决方案 方案六、优化数据中心和应用系统提高速度解决方案 14

方案七、预测分析解决方案 方案八、海量数据超高速查询解决方案 15

方案九、高校科研院所实验室大数据分析平台 方案十、WIFI(位置)数据分析解决方案 16

(订票点击行为+WIFI+位置+感应器+会员+交易数据) 举例 (行为—身份—匹配—推送—管理) 航空公司机场实时数据精准营销分析 (订票点击行为+WIFI+位置+感应器+会员+交易数据) VoltDB基础 概念与架构 17

数据分析架构图 Syncsort Confidential and Proprietary - do not copy or distribute 18

数据的采集+抽取+整合 一、通过WIFI采集的数据 (上了哪些网站?) 二、通过WEB数据抽取获得点击行为偏好数据 (在网站上正在干什么?) 三、通过刷卡交易获取储户身份和历史交易数据 (过去干了什么?) 四、通过动态行为(交易、监控、位置)获取实时数据 (还在干什么?) 五、各类数据的采集、抽取、整合

第一步:获取访问网站、链接、手机、IP等数据采集 主域 链接 1.1.1.29 13578937894 114.247.0.100:3070 http://114.247.0.100:3070/aiwmServPortal/rest/client/iswhite 1.1.1.16 13039312555 loc.map.baidu.com http://loc.map.baidu.com/loc 1.1.1.28 13504484587 msg.zhangyue.com http://msg.zhangyue.com/zybook/u/p/api.php?key=4U5&Ackage 1.1.1.13 18658180710 cc.cmbchina.com http://cc.cmbchina.com/vip/ pingma.qq.com:80 http://pingma.qq.com:80/mstat/report opensdk.uu.qq.com http://opensdk.uu.qq.com/analytics/upload 192.168.1.11 rq.drcct.cloud.duba.net http://rq.drcct.cloud.duba.net/query?1404456850 spdbccc.com.cn http://www.spdbccc.com.cn/zh/platinum/index.html switching.atm.punchbox.org http://switching.atm.punchbox.org/v1/?appid=CC150A4F 20

采集分析同一手机用户访问网站、内容、时间、IP等数据

机器学习 第二步:对访问的目标网站和网页的 数据抽取 自动 类似传统ETL过程 编码 可视化 样本分析 人为干预 形成规则及代码 配置好 : 交给机器就OK啦! 机器学习 自动 编码 类似传统ETL过程 可视化

把网上数据转化成你自己的数据库

自动全文抽取上网WEB数据 并进行机器学习和语义分析 24

订票点击数据机场 WIFI+实时数据实时分析 乘客点击行为情感偏好分析 点击行为 偏好数据 乘客身份类别 群组分析 WiFi 产品服务 定制分析 RTB产品精准营销 推送分析 业务通告宣传回访评分服务 合作商家 数据分析 各类历史数据 系统安全管理运行控制分析 机票代理动态监控分析 25

大数据厂商联盟服务 联盟做两件事 第一件事:宣传推广 第二件事:推荐产品和应用方案 厂商 CIO 大数据交流、交互、交易平台 CIO菁英部 会员部 推广部 渠道代理部 联盟做两件事 第一件事:宣传推广 第二件事:推荐产品和应用方案

大数据厂商联盟分销推荐产品 Cassandra据库 分析 可视化 平台 大数据可视化 大数据展现 深度学习 大数据可视化 大数据分析平台 预测分析 海量数据查询 NO SQL 数据 存储 高频内存数据库 图形数据库 文件数据库 Cassandra据库 数据 抽取 集成 管理 数据索引 数据抽取 WEB数据抽取 主数据管理 Hadoop优化 集群优化 安全管理 27

MongoDB、 Neo4j、VoltDB、Datastax、Hortonworks 商用版产品许可证及专有服务报价(到渠道价格) 产品及美国服务支持内容 基本服务 标准服务 企业级高级服务 安全 管理 ŸŸ 调优 认证支持平台 管理服务 英文支持 Cloud On-Prem & Cloud 中国市场包挂产品许可证+ 美国在线服务+中国专有服务 现场技术培训 认证 现场服务 28