阿里巴巴离线大数据处理平台概述 汤子楠.

Slides:



Advertisements
Similar presentations
面向侧面的程序设计 方林博士 本文下载地址:
Advertisements

LSF系统介绍 张焕杰 中国科学技术大学网络信息中心
“大云”大数据平台及应用 中国移动通信研究院 郭磊涛 2013年11月.
阿里云计算开放平台与产品 阿里云-刘飞 2012年10月.
云智慧助力在线医疗服务性能优化 —让IT运营更简单 2015年4月 云智慧科技(北京)有限公司.
华为- B 产品类型:CPE 建议零售价格:799元 上市时间: 2014年2月21日 目标人群:家庭用户,提供LTE上网的业务
CHAINFIN 供应链金融服务平台 供应商 物流商 采购商 融资 签订合同,融资 提供上游企业资质评估 提供资质评估 风控体系
三星—SCH-W999 建议零售价格:9380 元 上市时间:2011年12月
转正述职报告 乐恩公司 史航
企业级云计算 A Enterprise Cloud Serivce
Information & Security System in China China North Eastern Air Traffic Control Bureau (CAAC) Customer Background Subsidiary of General Administration of.
北京移动(中国移动的子公司)是中国主要的无线运营商之一。中国移动做为无线市场的开拓者,拥有中国70%的无线通信市场,也是世界上第二大的无线提供商,北京移动拥有上亿的手机用户,支持60多个国家的漫游业务。 为北京移动创造的价值 … 优秀的性能,支持了庞大的用户群 标准化了系统接口 加强了系统的灵活性.
基于R和pentaho的全套开源BI平台的实现
格物资讯开放ICON库 V1R1.
Kvm异步缺页中断 浙江大学计算机体系结构实验室 徐浩.
LSF系统介绍 张焕杰 中国科学技术大学网络信息中心
基于Hadoop的数据仓库Hive.
第二讲 搭建Java Web开发环境 主讲人:孙娜
GETAC—PS336-G1-T 外观设计 建议零售价格:13,830元 上市时间:2014年 2月1日 目标人群:户外现场作业人员
Chinese Virtual Observatory
R in Enterprise Environment 企业环境中的R
分布式数据分析算法 杨 旭 数据平台事业部-产品与平台服务.
从现在做起 彻底改变你自己 Sanjay Mirchandani EMC公司高级副总裁、首席信息官.
存储系统.
阿里数据同步的前世今生 巴真 陈守元.
基于OpenStack的散裂中子源计算环境概述 —CSNS私有云环境现状
华为—E8372h- 155 外观设计 产品类型:数据卡 建议零售价格:299元 上市时间:2017年6月7日 目标人群:大众
大数据管理技术 --NoSQL数据库 HBase 陈 辉 大数据分析技术.
Visual Studio Team System 简介
晟元大数据云平台 食品安全云大数据云平台 2017年4月 北京晟元亿讯科技有限公司.
产品介绍 MF825C 产品类型:上网卡 建议零售价格:599元 上市时间: 2014年 2 月20日 目标人群:商务人士、白领、IT潮人
数据挖掘工具性能比较.
厂商—型号 海尔-PAD002 外观设计 建议零售价格:2999元 上市时间:2011年3月 目标人群:有移动互联需求的商务人士
CPU结构和功能.
三星—SCH-P739 建议零售价格:3980元 上市时间:2011年12月
Azero: 一个大规模动态负载均衡图处理系统
C/C++/Java 哪些值不是头等程序对象
DevDays ’99 The aim of this mission is knowledge..
IDB-阿里集团数据库服务平台 叶正盛(斗佛)
三:基于Eclipse的集成开发环境搭建与使用
Unit 11.Operating System 11.1 What’s OS 11.2 Related Courses
程序设计工具实习 Software Program Tool
SOA – Experiment 2: Query Classification Web Service
《JAVA程序设计》 语音答疑 辅导老师:高旻.
解决变化问题的自底向上 流程建模方法 严志民 徐玮.
内容摘要 ■ 课程概述 ■ 教学安排 ■ 什么是操作系统? ■ 为什么学习操作系统? ■ 如何学习操作系统? ■ 操作系统实例
微机系统的组成.
$9 泛型基础.
第四章 团队音乐会序幕: 团队协作平台的快速创建
新一代企业IT与OpenStack 贾琨 2014年7月.
VisComposer 2019/4/17.
产品介绍 日修改版本: 去除:C+W统一认证功能:(是否支持) 小米3 外观设计 上市时间: 2014 年 2 月
商业分析平台-语义元数据 用友集团技术中心 边传猛 2013年 11月 06日.
产品介绍 TOPOLF-T198 产品类型:4G MIFI 建议零售价格:699元 上市时间: 2015年1月 目标人群:差旅人士
Cassandra应用及高性能客户端 董亚军 来自Newegg-NESC.
EC5373u-819 产品介绍 外观设计 产品类型:MIFI 建议零售价格:499元 上市时间:14 年 12 月12日
实验七 安全FTP服务器实验 2019/4/28.
计算机网络与网页制作 Chapter 07:Dreamweaver CS5入门
解决“最后1公里”问题.
Chapter 18 使用GRASP的对象设计示例.
Touch Github = Touch the World
华为—HUAWEI EC19 9 建议零售价格:299元 上市时间:2012年4月18日 目标人群:移动办公用户;其它有移动上网需求的用户
第二章 Java基本语法 讲师:复凡.
OpenStack vs CloudStack
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
Google的云计算 分布式锁服务Chubby.
基于列存储的RDF数据管理 朱敏
FVX1100介绍 法视特(上海)图像科技有限公司 施 俊.
网页版报名流程 Step 4 点击“详情”查阅具体岗位信息,输入身份数据及申请序列码进行最终报名
2019/9/19 互联网产业、立法与网规 张钦坤 腾讯法务部.
Presentation transcript:

阿里巴巴离线大数据处理平台概述 汤子楠

个人介绍 汤子楠 数据平台事业部,产品经理 2007~2010 移动互联网,触屏交互 2010至今 云计算,大数据

提纲 大数据时代 阿里巴巴数据事业部 离线大数据处理平台(ODPS) 我们面临的主要问题 ODPS部分功能概览 结语

大数据时代

大数据时代的挑战 数据关联性 处理能力 数据安全 商业模式 社交网络、用户行为、购买关系 企业内外IT系统的整合 数据规模爆炸式增长 结构化与非结构化数据并存、噪声增多 组合离线、在线、流式等多项计算能力提供解决方案 在大数据上应用传统统计学和数据挖掘算法 数据安全 用户隐私保护、商业数据泄漏、复杂的访问控制需求 企业发展的达摩克利斯之剑 商业模式 如何利用大数据盈利 数据驱动的新业务模式与企业传统业务模式的冲突

阿里巴巴的大数据产品探索

淘宝贷款 解决小微企业贷款难的问题: 完全以数据驱动的产品 对既有数据进行二次挖掘 颠覆原有业务模式 规模优势 金额高 流程长 授信难 周期长 完全以数据驱动的产品 对既有数据进行二次挖掘 颠覆原有业务模式 规模优势

阿里巴巴大数据事业部 离线存储 与计算 在线存储 实时计算 流式计算 任务调度 与管理 数据开发与数据可视化界面 数据同步 数据质量监控 元数据管理 安全与审计 计量与计费 服务化 API & SDK 算法库 数据产品 数据地图 数据共享 与合作

阿里巴巴离线大数据处理平台 ODPS (Open Data Processing Service) 支持海量结构化数据的离线存储和计算 以RESTful API的方式提供服务 基于阿里巴巴自主知识产权的分布式操作系统 支持高吞吐量的数据上传下载服务 支持SQL和存储过程 支持MapReduce、BSP编程框架 支持常用的矩阵运算和数据挖掘算法 支持多用户管理和基于ACL和policy的权限控制 基于ODPS可以打造完整的数据仓库解决方案

我们面临的主要问题 首先需要提供一个高效稳定的离线存储和计算引擎 如何支撑5万、15万台以上的机群规模? 多集群架构,运维和管理系统 如何在一个平台上支持多个组织的多个用户进行开发? 多租户支持,安全隔离,权限控制 如何了解业务运行状态? 元数据管理,指标系统 如何管理不同种类的任务? 服务化,统一计算入口,可度量和控制的计算资源 准实时查询,R-ODPS,…,我们还在继续探索

高效稳定的计算模型 SQL、Map Reduce仍然是离线运算的主流, 但是, 频繁IO带来的性能瓶颈… 模型描述能力的局限…

准实时查询 优势: 避免IO消耗 节约调度成本 劣势: Failover 资源占用 数据规模 适用场景: Ad hoc分析

图编程 功能: 挑战: 优势: 应用场景: 统一的API、授权、数据存储、meta Master-slave,worker负责子图 通过迭代在节点间通讯和修改图拓扑 挑战: 数据倾斜时的内存控制 与其他类型作业共存 错误恢复 优势: 方便处理图数据 多轮迭代性能远好于MR 应用场景: 推荐、社交网络、物流、…

利用图编程实现SSSP算法(1) GraphLoader – 图加载基类 public static class SSSPGraphLoader extends GraphLoader<LongWritable, LongWritable, LongWritable, LongWritable> { @Override public void load(Record record, MutationContext<...> context) { SSSPVertex vertex = new SSSPVertex(); vertex.setId((LongWritable) record.get(0)); String[] edges = record.get(1).toString().split(","); for (int i = 0; i < edges.length; i++) { String[] ss = edges[i].split(":"); vertex.addEdge(new LongWritable(Long.parseLong(ss[0])), new LongWritable(Long.parseLong(ss[1]))); } context.addVertexRequest(vertex);

利用图编程实现SSSP算法(2) Vertex – 点基类 public static class SSSPVertex extends Vertex<LongWritable, LongWritable, LongWritable, LongWritable> { @Override public void compute(ComputeContext<…> context, Iterable messages) { long minDist = (getId() == 1) ? 0 : Integer.MAX_VALUE; for (LongWritable msg : messages) { if (msg < minDist) { minDist = msg; } if (minDist < this.getValue()) { this.setValue(minDist); for (Edge e : this.getEdges()) { context.sendMessage(e.getDestVertexId(), minDist + getValue()); } else { voteToHalt();

利用图编程实现SSSP算法(3)

矩阵和算法运算支持 - ODPS 基于MPI的算法运算包 图形化交互界面 支持算法: 连接R与ODPS 集成ODPS的算法 SVD分解 逻辑回归 随机森林 … 连接R与ODPS 集成ODPS的算法 - ODPS

多集群架构 业务增长的速度永远快于技术完善的速度, 如何支撑日益膨胀的存储和计算需求?

多集群架构 多计算机群 解决规模瓶颈 统一meta 准实时数据同步 减少热数据跨机房 业务迁移 多控制机群 灰度发布 业务分离

多租户模型 如何支持多个团队在一个平台上开发?

多租户模型 用户空间 授权访问 跨空间访问 受保护的空间 空间互信

ODPS安全架构 数据安全是每个平台产品 需要解决的核心问题

ODPS安全架构 ODPS 客户端 (SDK, Console) ODPS接入层 Web 服务器 ODPS控制集群 ODPS服务 (Meta OTS Store) OdpsWorker Scheduler Executor Hive Server 计算集群n 计算集群1 …

3. 给Fuxi Job配置最小权限的Capability. SQL实例: INSERT OVERWRITE prjB.t1 AS SELECT a.shop_name, b.sale_total FROM prjA.shop a LEFT OUTER JOIN prjB.sale_detail b ON a.shop_name=b.shop_name; ODPS 客户端 (SDK, Console) 云帐号 用户认证 ODPS接入层 Web 服务器 … 域帐号 ODPS控制集群 飞天内部认证 与授权中心 ODPS服务 OTS (Meta Store) OdpsWorker Scheduler Executor Hive Server KDC (SSO服务) Shenshu (授权服务) 1. 认证. 计算集群n 2. 检查用户权限, 检查数据保护策略. 计算集群1 3. 给Fuxi Job配置最小权限的Capability. eg, pangu cap权限如下: { “pangu://odps/prjA/shop/”: R, “pangu://odps/prjB/sale_detail/”: R, “pangu://odps/prjB/t1/”: W } …

基于沙箱的纵深防御体系 ODPS 客户端 (SDK, Console) 云帐号 用户认证 ODPS接入层 Web 服务器 … 域帐号 用户提交的MapReduce程序可能会: 恶意耗尽集群资源(CPU, Memory, Network, Disk); 直接访问Pangu文件,窃取或篡改其他用户数据; 窃取Linux节点上的飞天系统进程的敏感数据(如Tubo的capability); ... ODPS 客户端 (SDK, Console) 云帐号 用户认证 ODPS接入层 Web 服务器 … 域帐号 ODPS控制集群 基于沙箱的纵深防御体系 飞天内部认证 与授权中心 ODPS服务 OTS (Meta Store) OdpsWorker Scheduler Executor Hive Server KDC (SSO服务) Shenshu (授权服务) 计算集群n 计算集群1 Guest OS Kernel Process Sandbox 1. Java沙箱 Java Sandbox … 2. Linux进程级沙箱 3. 虚拟机沙箱

灵活的授权方式 "Effect": "Allow", "Principal": "zinan.tang", { "Version": "1", "Statement": [ "Effect": "Allow", "Principal": "zinan.tang", "Resource": "acs:odps:*:projects/sampleprj/tables/test_*", "Action": ["odps:Update", "odps:Select"] "Condition" : { "IpAddress" : {"acs:SourceIp": "10.32.180.0/23"} } ]

数据上传下载服务 如何解决系统与多个数据源之间的数据交换问题? 背景: 产品线太多需要收拢 需要与DataX、TT分工整合 作为ODPS产品的一部分

数据上传下载服务 服务化:REST 结构化数据 流式数据传输 高并发上传下载 服务能力水平扩展 可靠传输 Failover & 断点续传 统一认证鉴权 流控和防攻击 提供可编程接口 背景: 产品线太多需要收拢 需要与DataX、TT分工整合 作为ODPS产品的一部分

利用ODPS Tunnel上传数据

结语 数据驱动的新商业模式是互联网产业下一个增长点 云计算能力是大数据应用的基石 分布式存储和计算的挑战 ODPS才刚刚起步 性能、稳定性、单点、通讯、故障恢复、状态机、… ODPS才刚刚起步 10万台、万兆网卡、分布式内存文件读写、…

谢谢大家!