UNIX 系统环境下 永不停顿的INTERNET服务技术 康柏电脑中国公司技术支持部 周厚文
Internet 环境面临的挑战与出路 挑战 出路 永不停顿的快速的安全的INTERNET服务 丰富的服务内容, 服务项目, 与经济大环境的 融合与集成 永不停顿的快速的安全的INTERNET服务 不中断客户服务情况下的业务扩展增容 降低管理成本, 增效 (系统,网络, 信息, 人员) 出路 采用先进的,适合自己的,宜发展的 信息技术
Internet, Web,电 子 商 务, ISP/ICP,... NonStop® e-Business 环境 Knowledge Management CRM GVC (ERP+SCP) 业务需求 系 统 管 理 、 安 全 管 理 Internet, Web,电 子 商 务, ISP/ICP,... 网 络 管 理 NonStop® e-Business 应 用 环 境 信 息 交 换 及 管 理 企 业 应 用 工 业 应 用 人 工 智 能 高 可 用 , 资 源 公 享 集 群 环 境 NonStop® IT 体 系 结 构 服 务 器 , 存 储 网 络 , 操 作 系 统 ,中 间 件 下 一 代 网 络 3
UNIX 系统环境下 永不停顿的INTERNET服务技术 (1) 基于网络 设备的 负载均衡/高可用性 (2) 基于单 机 的 RAS 环境 硬件, 操作系统 (3) 集群技术:NSPF, 应用高可用, 资源共享, 单一系统映象(SSI) (4) Round-Robin DomainNameSystem(DNS)
(1)基于网络 设备的负载均衡 / 高可用性
(1)基于网络 设备的负载均衡 / 高可用性
(1)基于网络 设备的负载均衡 / 高可用性 结论:适合于 小型 ISP/ICP, E-Commerce, E-Business “ Suitable for distributing clients requests across LOW-COST Servers ( Servers Farm) Load Balance among heterogeneous systems Additional Network Device is needed “Not support Load Balancing of traffic between Clients and Real Servers that are on the SAME LAN or VLAN” ( IOS SLB) “ Notice that a single Local Director(LD) handles ALL incoming traffic. The result is slower processing, potential bottlenecks, and throughput limitations. You will NEVER get more traffic to the servers than a single box can handle” “As an alternative, it is possible to create multiple virtual addresses; each managed by a different box(Local Director). However, this option SIGNIFICANTLY complicates network management” 复杂,重复 的 大量的 系统 / 网络 / 安全 配置, 管理 结论:适合于 小型 ISP/ICP, E-Commerce, E-Business
3 层 体系结构 的 高可用性 举 例 Client Load Web/Application DataBase/TP Balancer Servers Monitor 1# Switch PC Router Heart-Beat Line Internet LoadBalancer 2# Switch MC PC
(2) 基于单机 的 RAS 环境 硬件 RAS 性质:(Large Server Consolidation) - 高度模块化设计 - 高度模块化设计 - Hot-Plug, Hot-Add 系统组件(组件模块,电源, 磁盘, … ) - RAID 0, 1, 0+1, 3/5, RAID 柜部件 Hot-Plug, Hot-Add - 冗余部件(电源,磁盘, 风扇, 背板, IO 控制器) - 冗余控制台, 远程控制台 - 联机维修, 主电源/辅电源 局限行: - 不能达到无单点故障(NSPF) - 无故障时应用自动切换高可用性
(2) 基于单机 的 RAS 环境 操作系统 的RAS性质: - Auto IO load Balance & Fail Over(UltraSCSI, FC) (Multi-Pathing in Tru64 UNIX V5) - 保证重要应用系统资源的可用性:CPU/内存/网络 - 有效的系统/网络配置, 管理, 性能监 控调整 简便,功能齐全,集成化的 GUI/Web - Open VMS Galaxy
基于单机 的RAS 环境 局限性: Non-NSPF 二者配合( Large Server Consolidation ) - CPU 温拔插, IO controller 温拔插 - RAID 0, 1, 0+1, 3/5, 冗余, 热拔插部件 - Partitioning (分区) (1) 系统 分区(面向资源) WebServer / Mail / SAP/DB/... in different partitions simultenously, Fault- Isolation between Partitions GS80/160/320, Tru64 Unix( 不同OS,不同版本) E10000 , Solarias (相同OS的同一版本) (2) 软件分区: (面向资源和应用) Parallel processing, dynamically resources allocation for performance GS 80/160/320, ES40,... with OpenVMS Galaxy 局限性: Non-NSPF
GS80/160/320 Servers: Quad Building Block (QBB) Up to 4 Alpha EV67 CPUs @729Mhz > 35GB/s total BandWidth/QBB Up to 32GB Memory Up to 8 PCI Busses @ 200MB/s Up to 28 PCI Slots 6.4GB/s CPU Bandwidth 6.4GB/s Memory Bandwidth 1.6GB/s I/O Bandwidth EV67 Mem I/O Switch Global Port
Tru64 UNIX V5.x 系 统 监 控 窗 口(SMS)
Tru64 UNIX V5.x 系 统 事 件 监 视 窗 口(SMS)
Tru64 UNIX V5.x系统错误显示窗口
系 统 分 区 (GS80/GS160/GS320) Switch 2 1 QBB0 SIOM QBB1 Memory console 1 2 SIOM console terminal CPU Memory QBB1
系 统 分 区(GS80/GS160/GS320) Single Operating System Multiple Operating Systems UNIX V5.x OVMS UNIX Consolidate Tunning UNIX V5.y UNIX V4.x OVMS UNIX Respond to workload upgrades
软件分区(应用分区): OpenVMS Galaxy(1/99) Multiple Instances of Same Operating System Each Instance has its own Private CPU/Memory/ IO system resources Execute Cooperatively in a Single Computer Can have Shared Memory among the Instances Can Dynamically Adapted to Changing Application Needs Resources can be Dynamically Reallocated on Demand (CPU, Memory, IO) Processes can be Dynamically Migrated among Instances
Adaptive Partitioned Multi Processing 软件分区(应用分区): OpenVMS Galaxy(1/99) Adaptive Partitioned Multi Processing INSTANCE A INSTANCE B INSTANCE C CPUs 0 1 2 I/O CPUs 3 4 5 6 I/O CPUs 7 8 9 I/O INSTANCE A Private Memory INSTANCE B Private Memory INSTANCE C Private Memory SHARED MEMORY
OpenVMS Galaxy: 顶级高可用, 高服务性 分区 / 集群 技术 App A App B App C App A App A 应 用 分 区 App A App A App B App C App B App C Isolate consumptive applications Respond to workload changes
OpenVMS Galaxy: 顶级高可用,高服务性, 单机 分区 / 集群 技术 真正的内存互连分区: Multiple OS Instances Communicate via Shared Memory 真正的内存互连 的集群 真正的内存互连 的集群VLDB : No Protocol, Memory Level Latency 真正的 故 障时 用户/ 应用 的 自动切 换 (Fail Over) UNIX 集群 的方向: - SSI, CFS, Memory-Based Interconnection, - Single-System Management, Auto-Dynamic Load Balance D.H. Brown, Inc‘s White Paper, March,2000 Illuminate Inc’ s White Paper, Apr,2000 Technical Business Research’s White Paper: May,2000 Future TruCluster Server V5. X will achieve similar functionality, except Memory as the interconnect
NSPF, Application High-Available UNIX 集群 技术: NSPF, Application High-Available “ Clustering computing is becoming a widely accepted alternative method of providing Higher Availability and Scalability to mainstream computing products than can be provided by a Single System” “ Many system vendors have been improving various dimension of cluster technology. It can achieve a very high level of availability, which is more than adequate for the vast majority of critical applications requirements. It also provides a dimension of Scalability as an alternative to extending or upgrading a SINGLE SYSTEM, and many vendors offer the ability to couple OLDER installed systems into the cluster as an ECONOMICAL method of increasing compute power and High Availability” ( Technology Business Research, Inc on May. 4, 2000 , “Cluster Computing-- A Comparative Analysis”)
UNIX 集群 Node 1 Node 2 Node 7 Node 8 . . . . .
UNIX 集群 状况(1) Private System Disk UNIXServer UNIX Server Mirror Sets Client Client Client Client Network UNIXServer UNIX Server SCSI Controllers SCSI Controllers Workload Workload Workload Workload Mirror Sets Private Disk Private System Disk Private System Disk
UNIX 集群 状况 (2) 缺点: 新一代 UNIX 集群: TruCluster Server V5 优点: NSPF ( No Single Point of Failure ), Application Fail Over 缺点: * No Resources Sharing (OS disk, Disk, File, Data…..) * No Application Work Load Balance ( except OPS, XPS, Login Service) A Service can run ONLY at One Member at a time A disk can only be accessed by one member at a time Unless Fail Over * TCP/IP Based interconnect * Cluster Software is Network-Based, Not System Embedded * Difficult to Install /Manage/ Config / Upgrade,... 新一代 UNIX 集群: TruCluster Server V5
单 一 系 统 形 象 : SSI 新一代 UNIX 集群:TruCluster Server V5 CFS : 集群文件系统 共 享 资 源( OS, Disks, Files, Tape, Printer Queue,…) Cluster Alias :集群别名 设备名位置无关 单一系统管理 应用服载均衡 内存通道节点互联
双机 TruCluster Server V5.0 A集群 Memory Channel 8 * 8 Cross-bar Hub (1.6GB/s) 100MB/s 内 存 通 道 CD-ROM CD-ROM 数 据 盘 数 据 盘 磁带机/ 库 磁带机 磁带机 磁带机 图 形 显 示 控 制 台 (UNIX图形化管理用 ) 快 速 以 太 网 ATM, GIGA 图 形 显 示 控 制 台 (UNIX图形化管理用 )
TruCluster Server V5.0A 集 群 单 一 系 统 形 象 : SSI CFS 集群文件系统 DRD 分布式 I/O 指派 Cluster Alias 集群别名 MC 内存通道 / /usr /var /...
第 二 代 内 存 通 道 集 群 互 联 Memory Channel II 100MB/s Full Duplex link technology, 95MB/s channel bandwidth 8x8 Crossbar Switch Hub, 800MB/s Aggregate Bandwidth Supports links up to 3km (fiber) / 10m (LVDS copper) low latency, low overhead 2.1 usec end-to-end latency
TruCluster ServerV5.0A 集 群 集 群 文 件 系 统 : CFS 简 化 用 户及 设 备 管 理 按 装 一 次 共 享 根 目 录, 系 统 盘 共 享 文 件 系 统 /数 据 单 一 安 全 域 自 动 故 障 切 换 / /usr /var /...
客 户 机 看 集 群
集 群 别 名 TruCluster Server V5.0A 集 群 单 一 系 统 形 象 单 一 系 统 名 快 速 故 障 切 换 客 户 机 透 明 访 问 快 速 故 障 切 换 动 态 负 载 均 衡 Client Client Client Router Cluster - feline 1.1.1.0 AlphaServer jaguar 1.1.1.1 AlphaServer panther 1.1.1.2 AlphaServer cheetah 1.1.1.3 AlphaServer cougar 1.1.1.4
TruCluster Server V5.0A 集 群 , 快 速 故 障 切 换 应用服载均衡 应 用 负 载 均 衡 Single - Instance Application: Fail Over Mode Multi- Instance Application: 在所有节点上同时并行运行 Apache Web Server, NetScape Enterprise Server, NetScape Fast Track Server ASU, Others,… Distributed Parallel Processing: OPS, XPS
TruCluster Server V5.0A 集 群 高可 用, 负 载 均 衡 的 Web 服务环境
SMS 集 群 管 理 工 作 站 And as you click on these various pages, you can see some of the examples that will tell you information about the system and its status. An administrator can quickly, at a glance, understand what type of system it is and how it's operating and performing, again, using a standard Web browser, either Internet Explorer or Netscape This is key for system administrators in terms of ease of use and problem solving. The features we have in Tru64 UNIX allow an administrator (if appropriately authorized through security) to do all management of the system. They can not only monitor the system or view the status of the system but they can actually authenticate themselves and do all of the system management through the Web browser. This is an important out-of-the-box feature that typically UNIX vendors and even other NT vendors don't provide, and it's one of the value-adds that Compaq tries to provide, as an overall platform vendor, for all their platforms -- UNIX, VMS, NT
集 群 监 视 窗 口
浏 览 事 件 An example of events summaries and the log with a listing of events to monitor. In /var/evm/evmlogs directory
TruCluster Server V5.0A 管理成本 成 本 其 它 集 群 Costs Lower TruCluster Server V5 help 节 点 数
TruCluster Server 集 群 V5.0 二 进 制 兼 容 Tru64 UNIX V5 应 用 Cluster Application Application Application Cluster Single UNIX System
强&大的WildFire GS160/320集群 MC Hub FCSwitch HSG80 HSG80 After the v5.0 release…a new generation of AlphaServers (Wildfire) is planned. These new servers will extend the performance and scalability of a cluster. Enhancements to the memory interconnect will also be planned.The performance planned is significant! FCSwitch HSG80 HSG80
应 用 环 境(TruClsuter Server v5 之前) 企 业 应 用 服 务 企 业 经 营 /管 理 用 户 开 发 应 用 Web/邮 件服务 打 印 /文 件 服 务
应 用 集 成 环 境 企 业 应 用 集 成 环 境 企 业 经 营 /管 理 用 户 开 发 应 用 Web/邮 件服务 打 印 /文 件 服 务
Illuminate Research Report, Apr,2000 集群功能 Compaq HP IBM SUN 单系统映像 公用集群地址 支持根共享的文件系统 管理单个系统和集群使用相同的工具 事件管理 可配置失效切换/复原 世界级的服务和支持 支持服务器的范围 集群别名(人工负载均衡) 无单故障点 滚动升级 先进的存储管理 集群范围内PC集成 容灾集群 集群内的混合服务器 集群内的最大节点数量 高可用性备份服务 (例如共享磁带) 在线服务调整
感谢计算机世界! 感谢大家的支持和帮助! 康柏 公司真诚祝愿个位成功! 康柏 公司愿与大家真诚合作!