基于openstack的虚拟资源调度技术研究

Slides:



Advertisements
Similar presentations
第2章第2章 第 1 节 生物与非生物. [ 猜谜语 ] 名字叫做牛, 不会拉犁头; 说我力气小, 背着房子走。 ( 打一动 物)
Advertisements

阻塞操作. 在 linux 里,一个等待队列由一个 wait_queue_head_t 类型的结构来描述 等待队列的初始化: static wait_queue_head_t testqueue; init_waitqueue_head(&testqueue);
什么是遗传病? 它与非遗传病 如何区别 遗传病:是由引起 遗传病:是由遗传物质改变引起 的或者是由所控制的人 类疾病. 的或者是由致病基因所控制的人 类疾病.基因 遗传病的概念.
少年儿童营养配餐与饮食安全 科学饮食为孩子的未来积攒本钱.
接地、屏蔽、滤波 并称为电磁兼容的三大抑制技术
當我已老 謹以此文獻給像我一樣流浪在外的子女們.
母婴护理与保健 孕妇培训课程 胎儿保健 聊城职业技术学院 王守军.
庄国洪 Tel: (O) 免疫与健康 庄国洪 Tel: (O)
2015年12月14日-2015年12月20日 缩略版.
指導老師:羅夏美 組別:第四組 組員: 車輛二甲 蔡中銘 車輛三甲 莊鵬彥 國企二甲 陳于甄 國企二甲 詹雯晴 資傳二乙 林怡芳
LSF系统介绍 张焕杰 中国科学技术大学网络信息中心
可爱的蜗牛 一、蜗牛冬眠 二、蜗牛进食 三、蜗牛排泄 四、蜗牛呼吸.
校园信息管理系统 河北科技大学网络中心 2000/4/10.
“网络问政”给九江新闻网 带来新的发展机遇 -- 九江新闻网 高立东 --.
检验员基本知识学习 2014年7月15日.
徵收苗栗市福全段147、1588及文心段10、11地號等4筆土地之
第四章:代谢与平衡 第一节:食物与营养.
KVM简介 指导老师:孟宁 学生:卢鹏.
讲 义 大家好!根据局领导的指示,在局会计科和各业务科室的安排下,我给各位简要介绍支付中心的工作职能和集中支付的业务流程。这样使我们之间沟通更融洽,便于我们为预算单位提供更优质的服务。 下面我主要从三方面介绍集中支付业务,一是网上支付系统,二是集中支付业务流程及规定等,
中国人民公安大学经费管理办法(试行) 第一章总则 第四条:“一支笔” “一支笔”--仅指单位主要负责人。负责对本 单位的经费进行审核审批。
项目四 组建跨地区网络 授课教师:肖颖.
社会工作概论 个案工作 课程培训 深圳电大 赖小乐.
课程中心 课程中心培训方案 上海泰泽信息技术有限公司
宁波材料所高性能计算集群普通用户培训 曙光公司.
前言.
Kvm异步缺页中断 浙江大学计算机体系结构实验室 徐浩.
LSF系统介绍 张焕杰 中国科学技术大学网络信息中心
Linux 切换、 创建和删除目录 系统管理 宁波市高校慕课联盟课程
第二讲 搭建Java Web开发环境 主讲人:孙娜
从现在做起 彻底改变你自己 Sanjay Mirchandani EMC公司高级副总裁、首席信息官.
高能物理云计算应用 中国科学院高能物理研究所 计算中心 程耀东 2016年6月6日.
高能物理云平台中的弹性计算资源管理 中国科学院高能物理研究所计算中心 程振京 sce2017 Weihai,
SVN服务器的搭建(Windows) 柳峰
管理信息结构SMI.
Jul 2014 HEAT部署Hadoop集群
基于OpenStack的散裂中子源计算环境概述 —CSNS私有云环境现状
网络常用常用命令 课件制作人:谢希仁.
大数据管理技术 --NoSQL数据库 HBase 陈 辉 大数据分析技术.
DM81X 视频采集处理 ——简单采集显示例程讲解 广州创龙电子科技有限公司
PostgreSQL 8.3 安装要点 四川大学计算机学院 段 磊
Windows网络操作系统管理 ——Windows Server 2008 R2.
第十章 IDL访问数据库 10.1 数据库与数据库访问 1、数据库 数据库中数据的组织由低到高分为四级:字段、记录、表、数据库四种。
KVM虚拟机性能优化与应用 黄秋兰 高能物理研究所
黄秋兰/高能所计算中心 Fabio Hermandez/IN2P3-CC
PaPaPa项目架构 By:Listen 我在这.
❶云端下载 请根据自己的手机系统(支持IOS系统与Android系统)选择下述下载方式: 手机系统 应用搜索下载 二维码扫描下载 IOS系统
作业调度系统常用命令.
第十八届全国科学计算与信息化会议 虚拟计算中的虚拟机调度与控制研究 崔涛、程耀东 2017年07月05日.
三:基于Eclipse的集成开发环境搭建与使用
程序设计工具实习 Software Program Tool
内容摘要 ■ 课程概述 ■ 教学安排 ■ 什么是操作系统? ■ 为什么学习操作系统? ■ 如何学习操作系统? ■ 操作系统实例
$9 泛型基础.
第四章 团队音乐会序幕: 团队协作平台的快速创建
YARN原理和基本框架 张伟.
实验七 安全FTP服务器实验 2019/4/28.
微信商城系统操作说明 色卡会智能门店.
信号量(Semaphore).
本节内容 文件系统 视频提供:昆山爱达人信息技术有限公司 官网地址: 联系QQ: QQ交流群 : 联系电话:
2019/5/10 网络学习空间实务操作.
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
2.2矩阵的代数运算.
临界区问题的硬件指令解决方案 (Synchronization Hardware)
OpenStack vs CloudStack
【VA虚拟应用管理平台】专题培训 接入防火墙 陕西益和信息技术开发有限责任公司 2011年2月.
基于列存储的RDF数据管理 朱敏
本节内容 动态链接库 视频提供:昆山爱达人信息技术有限公司 官网地址: 联系QQ: QQ交流群 : 联系电话:
大綱 一.受試者之禮券/禮品所得稅規範 二.範例介紹 三.自主管理 四.財務室提醒.
2.1 试验: 探究小车速度随时间变化的规律.
104學年度第二學期 燈音開課 03/14燈光開課.
JUDDI安装手册.
Presentation transcript:

基于openstack的虚拟资源调度技术研究 中科院高能物理研究所计算中心 李海波 2015-8-18

提纲 研究背景及意义 系统架构 动态调度算法 下一步工作

集群环境及存在问题 高能物理作业是数据密集型计算,具有数据量大、应用类型多的特点,目前采用物理机集群,每个应用有专门的队列集群。 存在问题: 资源利用率不高 多应用抢占 资源共享性差

虚拟集群技术 虚拟集群 面临的挑战 提高资源利用率 提高资源调度效率 提高平台异构性 简化管理 绿色,节能 1.底层虚拟化平台的选择:openstack 2.PBS队列调度系统(Torque、Condor)不支持虚拟机队列 3.虚拟资源的管理与调度

底层虚拟化平台选择:Openstack 主流开源云计算平台,功能强大 部署方便,技术成熟 提供openAPI,方便二次开发

虚拟资源管理与调度 系统组件 虚拟作业层 虚拟机资源管理层 虚拟化平台层 PBS调度系统建立虚拟队列 负责虚拟机的启动、停止 区分不同的作业类型 虚拟化平台层 负责作业的运行

虚拟作业表 由Torque或Condor等队列调度系统生成,供虚拟平台拉取作业使用。 表结构 用户提交的作业的基本信息,如作业名、用户名、用户属组等信息 虚拟作业的属性信息,包括虚拟作业队列名称、虚拟机地址、虚拟机心跳时间 字段值 说明 job_hashname 作业id egroup 用户所属组 job_name 作业名字 status 作业运行状态 init_workdir 提交作业目录 exit_status 作业退出状态 output_path 标准文件输出路径 vm_ipaddr 虚拟机地址 error_path 错误文件输出路径 vm_procid 虚拟作业id shell 作业运行shell环境 last_heartbeat 虚拟机心跳时间 varlist 环境变量列表 queue_name 虚拟作业队列名称 mom_exec_host PBS作业执行节点 to_be_deleted 作业是否删除 euser 用户名 others1others2 预留字段

运行流程 采用推拉结合的作业运行方式 1)用户通过Torque或者Condor方式提交作业后,作业信息被推送到虚拟作业表里。 2)虚拟资源管理层通过虚拟作业表里的作业队列信息,进行相应队列类型的虚拟机启动。 3)虚拟机启动后,虚拟机上的进程向虚拟作业表请求作业信息,取到对应类型的作业后执行此作业。 4)作业执行结束后,虚拟机上的进程将作业输出写回,并再次执行拉取作业过程,同时监控虚拟机的作业状态,在虚拟机运行作业时,保证虚拟机不会被删除。

技术实现 Openstack API包接口 虚拟机上的jobagent 每次调用时会面临一些初始化问题,以及tokens失效等问题,调用不方便 将openstackAPI重新打包,方便虚拟集群调用 虚拟机上的jobagent 实现“拉”作业的功能 虚拟机上内置jobagent进程 始化作业运行环境,包括用户身份的转换,shell的设置,作业运行环境变量设置 监控虚拟机状态

动态调度算法 虚拟机启动调度 jobagent作业拉取 虚拟机删除

变量声明 定义: 状态字段: 需要启动的虚拟机数量:VT 当前处于创建状态的虚拟机数量:VB 当前处于删除状态的虚拟机数量:VD 当前作业id:P 虚拟机类型:VM_type 当前系统虚拟机配额:Q 当前处于activie状态的虚拟机列表:VM_IP_LIST 当前active的虚拟机数量:VA 状态字段: 状态标示 说明 初始值 ispull 是否可以拉取作业 True:可以拉取 Isdel 是否可以删除 Flase:不能删除

虚拟机启动调度 线性加减法 Measure #VT,#Q,#VA,#VB,#VD VN = VT - VA if VN==0 then //虚拟机当前运行数量与所需数量相等 return elif VN > 0 then //启动虚拟机 if VN >= Q – VA then startVM(VM_type,Q - VA) elif VN < Q – VA then startVM(VM_type,VN) elif VN < 0 then //关闭虚拟机 delete(VM_type,-VN)

虚拟机删除 1. 遍历active状态的虚拟机,从中选择(VA-VT)个虚拟机,通过vmID得到IP 地址,对这些IP的虚拟机发送delete 请求信息; 2. 客户端收到isdel=true时,再调用stop_vm接口。

jobagent拉取作业算法 设置两个标志位 当虚拟机拉取到作业后,将isdel状态设置为不可删除状态, 设置环境,运行作业 Ispull:是否可以拉取作业,默认可拉取 Isdel:是否可以删除,默认不可删除 当虚拟机拉取到作业后,将isdel状态设置为不可删除状态, 设置环境,运行作业 当此作业运行完成后,将isdel变为可删除状态。 如果此时jobagent收到虚拟机管理层发来的虚拟机是否可删除询问时,将ispull状态设置为不可拉取作业状态,这样就可以关闭此虚拟机。

下一步工作 虚拟资源监控 虚拟调度策略优化 Cluster集群模式下的虚拟资源调度

小结 提出一种支持队列调度系统与openstack结合的虚拟资源动态调度系统。 对用户透明。 能够有效提高计算资源使用效率。

谢谢!