面向Web的Oracle应用 第19章 集群概述
本章主要内容 集群产品概述 Oracle支持的RAC环境 RAC产品安装、配置常见问题及解决方法 小结
1、RAC产品概述
1)RAC的优点 多节点负载均衡; 提供高可用:故障容错和无缝切换功能,将硬件和软件错误造成的影响最小化; 通过并行执行技术提高事务响应时间----通常用于数据分析系统; 通过横向扩展提高每秒交易数和连接数 ;----通常对于联机事务系统; 节约硬件成本,可以用多个廉价PC服务器代替昂贵的小型机或大型机,同时节约相应维护成本; 可扩展性好,可以方便添加删除节点。
2)RAC的缺点 相对单机,管理更复杂,要求更高; 在系统规划设计较差时性能甚至不如单节点; 可能会增加软件成本(如果使用高配置的pc服务器,Oracle一般按照CPU个数收费)
2、Oracle RAC/Clusterware的结构和组件 服务器 >= 2 操作系统,推荐使用Oracle认证的系统;版本不要太老,也不要太新 CPU/内存,根据业务需要,内存至少1G 本地磁盘空间,>=30G 网卡 >=2 ,推荐4个以上千兆网卡 私有以太网络,推荐千兆交换机以上 HBA卡 ,如果是SAN,推荐2个冗余HBA 共享存储设备,推荐SAN设备 存储管理, ASM/Cluster LV/裸分区/CFS,不推荐用OCFS,卷管理软件、多路径软件等 第三方集群软件: 可选 Oracle Clusterware 软件 Oracle RDBMS 软件
Clusterware主要进程 crsd: 负责管理集群的高可用操作。管理的crs资源包括数据库、实例、监听、虚拟IP,ons,gds或者其他,操作包括启动、关闭、监控及故障切换。改进程由root用户管理和启动。 cssd,管理各节点的关系,用于节点间通信,节点在加入或离开集群时通知集群。该进程由oracle用户运行管理。 oprocd – 集群进程管理 —Process monitor for the cluster. 用于保护共享数据IO fencing。 evmd :事件检测进程,由oracle用户运行管理。
Clusterware使用的共享设备 Oracle Cluster Registry(OCR):记录集群的配置信息; Voting disk : 即投票盘,保存节点的成员信息,当配置多个投票盘的时候个数必须为奇数,每个节点必须同时能够连接半数以上的投票盘才能够存活;
2、Oracle支持的RAC环境 官方不支持的:Vmware, Sun LDOM ,Solaris Local Container/Zones 官方支持的: IBM LPAR, IBM VIOS(Virtual IO Server), Solaris Global Containers RHEL GFS , ISCSI, 私有网络(心跳线)的支持: 不支持使用交叉线,支持 Infiniband RDS (10gR2之后) 异构环境:支持不同的硬件、但相同的软件(OS/Oracle)组成的集群,不支持32位与64位系统间的集群 目前支持的NFS的server包括: EMC Celerra Fujitsu Filer NR1000 Series IBM N Series NetApp FAS, F, G Series Pillar Data Systems Axiom 500 Sun StorageTek 5000 Series
3、安装RAC常见问题 安装CRS失败,或执行root.sh报错; 解决方法:分析更细原因,一般由大约13种原因造成,具体见参照文档。 客户端有时候报错; 解决方法:设置local_listener初始化参数 如果选择节点界面出不来。 HACMP环境中需要检查oracle 用户必须在 hagsuser组里. 如果是hacmp5.4,需要打Oracle补丁6718715; 可以使用集群配置文件cluster CONFIGURATION FILE 内容模板
AIX上数据库启动报错 原因:没有设置网络参数udp_recvspace/udp_sendspace Windows平台,ORA-600 [kccsbck_first] 解决方法:关闭Media Sense(媒体感知) 系统循环重启 可能是CRS导致,如果因为crs,首先设置 crsctl disable crs 来禁止oracle crs的自动启动。查看OS、crsd和cssd的对应日志
Thank You! 钱剑飞