Presentation is loading. Please wait.

Presentation is loading. Please wait.

NEC Express5800 Fault Tolerant Server Introduction

Similar presentations


Presentation on theme: "NEC Express5800 Fault Tolerant Server Introduction"— Presentation transcript:

1 NEC Express5800 Fault Tolerant Server Introduction
台灣恩益禧股份有限公司 2016 年 10月 19日

2 目錄 前言 關於NEC FT Server 高容錯架構 架構比較說明 實際案例分享

3 前言

4 NEC System HW Nippon NO.1

5 企業虛擬化應用逐漸擴展 更加凸顯硬體基礎建設的重要性 60%的資訊人員面對Open System最大的疑慮:穩定性
雲端世代的IT基礎建設 企業虛擬化應用逐漸擴展 更加凸顯硬體基礎建設的重要性 60%的資訊人員面對Open System最大的疑慮:穩定性 30%硬體擴充整合/效能表現 10%作業系統延伸成本 GeminiEngine™ Hardware HA License Decline 5min/year Downtime 0 second Recovery Cluster? License? Downtime? Recovery Time?

6 FT伺服器 新世代機型「R320e-M4、R320e-E4」
第7世代(2015~) R320e-M4 R320e-E4 ・10コアCPU支援 ・10Gbpsネットワークカード 支援 ・EXPRESSSCOPEエンジン3搭載 ・6コアCPU支援 ・Windows Server 2008R2/Hyper-V対応 ・クロック生成回路の備援 ・クアッドコアCPU対応 ・ActiveUpgradeオプション搭載 ・仮想環境(VMware)支援 ・NEC開発の備援LSI“GeminiEngine(TM)”搭載  ・デュアルコアCPU対応  ・Windows Server 2003支援  ・Xeonを搭載し、更に高性能化 第6世代(2012~) R320c-M4/E4 R320d-M4 第5世代(2009~) R320a-M4/E4 R320b-M4 ・世界初のPC伺服器ベース フォールト・トレラント伺服器  第4世代(2008~)  320Fc-MR 320Fd-MR/LR ・12core CPU支援 ・最大512GB記憶體搭載可能 ・對應Windows2012R2 ・運作環境温度可對應達40℃ ・可搭載RDX連接USB port 第3世代(2006~)  320Fa-MR/LR 320Fb-MR/LR 第2世代(2003~)  320Lb-R 320Lb2-R 320Lc-R 第1世代(2001~)  320La-R

7 Fault Tolerant Server R320e
經濟實惠的投資成本 提供最高水平的可用性 R320e-M4 / E4 M4:Intel Xeon Processor E v3 12C (2.30GHz) E4:Intel Xeon Processor E v3 8C (2.40GHz) 全面支援主流作業系統與虛擬化應用 GeminiEngine™ For RHEL Virtualization (KVM/LXC) is not supported.

8 1.關於NEC FT Server

9 1.1 什麼是 FT 伺服器? NEC Express5800/FT 伺服器 藉由硬體備援機制保證高可用性, 重要的服務永不中斷
一台伺服器中有提供備援的模組、兩個模組會同步運轉 “FT” 意謂著 “Fault Tolerant” 容錯的意思, 表示即使是在某個零件發生故障的情況下系統仍可以維持正常運作

10 可利用在以下情境 1.2 如何應用FT Server? 生産/物流管理 → 系統故障發生時生產線能持續運作。
生産/物流管理 → 系統故障發生時生產線能持續運作。 商品/顧客情報管理 → 當故障發生時能持續提供顧客服務。 通信控制 → 提供通訊控制的重要基礎建設不停頓。 醫療系統 → 守護攸關性命的系統,絕不能停止服務。 伺服器整合 → 透過高容錯伺服器建立大量伺服器叢集,確保服務不中斷。 硬體高可用度 → 防止因為硬體設備故障而造成的資料遺失與系統停擺。 維護不便 → 當故障發生時,無法迅速抵達現場,希望即使發生故障系統 也不停擺。

11 1.2 Fault Tolerant Server Enhancement
高效能 CPU /更大的硬碟空間 支援 Windows Server 2012R2(Hyper-V) / VMware/ Red Hat Linux 新一代架構 功能強化 採用最新 12 核心 (1.25 times) Intel® Xeon® Processor E v3 CPU,比前一代容錯伺服器 高出 30% 效能,可建置 更多 VM 虛擬主機 支援 iSCSI (1000BASE-T) 功能強化 擴充性 若採用 1.2TB SAS 硬碟,總容量最大可達 9.6 TB 2組 10Gbps 網路埠 SSD (eMLC) 高速 IO 存取 Key 功能強化 節能省電 80PLUS® Platinum 電源供應器 搭配低電壓 DDR4L 記憶體 功能強化 可用性 管理 內建 EXPRESSSCOPE Engine 3 技術,支援遠端監控管理 配有新版 “EXPRESSBUILDER Ver.7” 系統設定光碟,支援 Microsoft® Windows Server® 2012 Hyper-V 自動設定, 亦可顯示伺服器各驅動程式及應用程式的版本,以便資產管理

12 2.高容錯架構

13 Express5800/FT伺服器特色 ③ 備援機制不需要特別設定 ② 熱抽換元件   ① 服務不中斷   ④ 虛擬化環境支援(VMware/Hyper-V)

14 2.1 服務不中斷 硬體備援保證服務不因單一元件故障而中斷 GeminiEngine™ 實現 Lockstep 運轉
模組#0 模組#0 Memory LAN CPU Gemini Engine HDD SAS RAID1 同步 運作 CPU PCI Memory Memory LAN CPU Gemini Engine HDD 模組#1 SAS R320e-M4(前面)  CPU PCI Memory 模組#1 GeminiEngine™ 實現 Lockstep 運轉: 備援的模組同時運轉,發生故障的模組會馬上被隔離 12/8核心 Intel® Xeon® 處理器 E v3 / E v3 (2.3G/2.4GHz)   GeminiEngine™ 實現 Lockstep 運轉 且不影響 CPU 和 Memory 的效能

15 2.2 熱抽換元件 系統發生故障時可不停機維修 1 4 2 3 業務 業務 業務 業務 【障礙發生時流程】
備援動作 備援元件以 Lockstep 方式當作一台邏輯伺服器運轉 【障礙發生時流程】   1 自動同步 處理 業務 持續運作 4 2 業務 業務 故障CPU交換 持續運作 業務 自動隔離 新的模組會與其他的元件重新同步 故障發生,將故障的模組隔離,系統運轉不受影響 模組拔出 3 維修時不需停機   FT Server全模組支援熱抽換 實現維修不需停機

16 2.3 繼續使用既有 Windows / Linux 應用程式
既有的應用程式和中介軟體可繼續使用 在 Windows / Linux 上執行的 應用程式 / 中介軟體 作業系統和軟體 不需要作備援的設定 無須作特別修改 Windows Server 2012 Std/Datacenter R2 Windows Server 2008 Enterprise R2 SP1 Red Hat Enterprise Linux 7.2 作業系統與一般 的 IA 伺服器相同 FT 控制軟體 (備援控制軟體) 強化 LAN、SCSI、Video 等裝置的驅動程式 硬體 GeminiEngine™ 與一般IA伺服器相同 FT特點 使用一般的 IA 伺服器 OS,不會增加額外的花費

17 2.4支援虛擬化環境(VMware/Hyper-V)
理想的集中管理伺服器的高可用性虛擬平台    APP APP APP 一般OS/APP無需變更即可運作 Guest OS Guest OS Guest OS VMware/Hyper-V VMware/Hyper-V實際的虛擬架構不需要針對備援有任何特殊考量 支援備援的驅動程式 (LAN, SCS, Video etc.) FT Control SW (Redundancy control SW) GeminiEngine™ GeminiEngine™ 模組#0 模組#1 FT伺服器 在使用Hyper-V的狀態下,當系統重新同步時,會短暫中斷,時間長短需以記憶體大小而定 容錯伺服器可降低在集中管理伺服器之後的硬體故障風險

18 2.4支援虛擬化環境(VMware/Hyper-V)
透過FT伺服器避免系統環境整合所增加的風險 【一般的伺服器】 【Express5800/FT伺服器】  系統A (仮想伺服器) 系統B (仮想伺服器) 系統C (仮想伺服器) 系統A (仮想伺服器) 系統B (仮想伺服器) 系統C (仮想伺服器) VMware/Hyper-V VMware/Hyper-V HW HW HW 同期動作 硬體障礙 ⇒無硬體備援設計,故障時系統直接停止 硬體障礙 ⇒備援模組可提供持續運作  停擺風險 停擺風險 極小化

19 2.5 信賴性及可用性 FT 容錯伺服器 + 叢集軟體 容錯伺服器 單一伺服器 選擇高可用性的硬體與軟體 依照系統需求搭配最佳的解決方案
單一伺服器的高可用性 FT 容錯伺服器 + 叢集軟體 備援硬體 (雙模組架構) 硬體發生故障時還能照常持續運作 簡易安裝及操作 容錯伺服器 容錯伺服器 與 叢集軟體 強化硬體的容錯性 單一伺服器 (傳統伺服器) 叢集軟體 強化系統可用性 部分硬體備援 (例如 HDD, PSU) 強化 硬體與軟體的 故障 resilience 特別是針對有擴點計畫的大型系統 在多台伺服器之間Failover 系統可用性更高 依照系統需求搭配最佳的解決方案

20 2.6 FT Server+EXPRESSCLUSTER X
主中心高可用度的完美實現 HW/SW高可用度完整架構 軟體故障 Stand by Sever Failover EXPRESSCLUSTER X軟體監控 OS APP Module #0 Module #1 APP OS Module #0 Module #1 FT伺服器 硬體故障 FT伺服器(Stand by) FT伺服器(Active) 建立萬無一失的重要核心系統高可用度

21 2.7 FT Server + 虛擬化 + EXPRESSCLUSTER X
軟體故障 EXPRESSCLUSTER X監控軟體 當軟體發生故障,會自動切換到另一個 Guest OS Guest OS Apps Guest OS Apps VMware/Hyper-V FT伺服器 硬體故障 Module #0 Module #1 FT伺服器 具備虛擬化系統需要的硬體與軟體高可用度

22 2.8 支援NEC大容量儲存設備 DB核心業務伺服器 對應大容量資料擴充方案 ◆PATH備援 ◆SAN儲存設備 ■ M110
透過Fiber Channel連接儲存設備 對應HW-RAID高速且信頼性高的資料保全機制 FT伺服器 Storage Path Manager ■       M110 モジュール#0 モジュール#1 FC最大8port搭載  Disk容量最大可擴充至379.1TB   Fiber Cannel Controller Fiber Cannel Controller 伺服器=儲存設備の パスも備援!  FCケーブル FCケーブル iStorage デュアル ポート機構 デュアル ポート機構 可整合多台伺服器連接 可提供(DDR)機能活用 可建立系統不停擺的備援環境 ◆SAN儲存設備 M310 Fiber- Channel Switch FC 8Port 最大480HDD (2.5型HDD) iStorage M310 FT伺服器 連接SAN 環境

23 3.架構比較說明

24 < < 1way 2way FT Server 3.1與一般X86伺服器備援比較 主要部品備援比較 高可用 無備援 可備援 熱插拔 IO卡
1way 2way FT Server CPU CPU CPU CPU CPU CPU CPU 晶片組 晶片組 晶片組 晶片組 IO卡 IO卡 IO卡 IO卡 記憶體 記憶體 記憶體 記憶體 記憶體 冷卻風扇 冷卻風扇 冷卻風扇 冷卻風扇 電源供應器 電源供應器 電源 供應器 電源 供應器 HDD HDD HDD HDD HDD HDD 高可用 風扇熱挿抜 記憶體備援 主要部品均有 模組化的備援 HDD備援 電源熱挿抜

25 (4) 應用程式重新啟動需要數秒到數分鐘的時間
3.2 系統復原 (硬體) NEC Express5800/FT Server  持續運轉 故障發生 服務不中斷 系統復原 運轉 運轉 運轉 (1) 立刻將有故障元件的模組獨立出來 (2) 將更新的模組重新同步 Module #0 將故障模組獨立出來 運轉 Lockstep 更換模組 運轉 運轉 Module #1 叢集系統 開始執行備援 故障發生 備援動作完成 系統停止服務時間可能長達10多分鐘 運轉 系統停止服務 運轉 暫停數秒鐘 (2) 選擇備援的主機 - 數秒鐘到數分鐘 (4) 應用程式重新啟動需要數秒到數分鐘的時間 (3) 工作交接 (網路, 磁碟設定) - 數秒鐘到10分鐘 維修/交換 備援

26 FT伺服器達成硬體HA,叢集系統完成軟體Cluster
3.3 NEC 容錯伺服器 和叢集系統比較 FT 系列 叢集系統 目的 單一伺服器的超高可用度 可用度 / 延展性/ 負載平衡 特色 備援 備援 負載平衡 備援過程 故障 交接 故障 CPU CPU 搭配 FT伺服器可保證系統備援完整性。 FT伺服器達成硬體HA,叢集系統完成軟體Cluster 獨立出來 CLUSTERPRO Mem. Mem. HDD HDD 將故障元件獨立出來 備援到不同的伺服器 當故障發生時 持續運轉 (服務不中斷) 因為備援的程式,運轉中斷 (幾分鐘到 10多分鐘) 能夠對抗 硬體故障 軟硬體故障 改善效能 增加 CPU 增加 CPU 和增加節點 支援的應用程式 一般的應用程式不需要修改 需要進行工作交接的程序 (撰寫 Script 批次程式) 系統部署簡單 (無須更改應用程式) 商業運轉不中斷 24 x 7 可用度可執行關鍵的工作 / / 網頁伺服器工作 可用度和負載平衡 能夠於軟體發生故障時恢復 支援系統效能擴充 (節點可擴充)

27 3.4 NEC 容錯伺服器 – 技術性上的優勢 FT Server System Cluster 可用度 系統恢復時間 資料損失 系統效能
99.99% (DMR) / (TMR) (43分鐘 / 5分鐘平均每年) 接近零秒 幾乎不發生(記憶體和硬碟) 2顆 CPU 無須任何工作 不需要 1 個作業系統 幾乎不用 99.9 % (平均每年大於 8小時) 大約 1分鐘 硬碟保護有限 伺服器與節點可擴充 Script 開發和測試 建議 多系統叢集(至少 2個作業系統) 需要大量 可用度 系統恢復時間 資料損失 系統效能 導入 應用程式修改 作業系統 IT 支援

28 3.5 DB系統建置成本比較表(TCO) 總成本: NT$ 16,299,505 NT$ 32,751,549 節省兩倍支出 項目 細項內容
NEC FT容錯伺服器 (硬體備援) 一般伺服器 (叢集軟體備援) 說明 數量 價格 硬體 x86伺服器硬體 1 NT$ 1,200,000 2 NT$ ,000 FT Server及一般Rack Server價格 三年保固 OS Red Hat Enterprise Linux Server Premium Support per Year 5 NT$ ,635 10 NT$ ,270 RedHat 作業系統 5年服務 DB Oracle DB SEO by Core 12 NT$ ,292,270 24 NT$ ,584,541 ORACLE 資料庫及共3年MA Oracle 維護費用(22% per Year) NT$ 4,528,600 9,057,200 Cluster Oracle RAC NT$0 4 NT$ 1,221,607 RAC及共3年MA 730,931 總成本: NT$ ,299,505 NT$ ,751,549 節省兩倍支出

29 3.5人力成本比較 項目 細項內容 NEC FT容錯伺服器 (硬體備援) 一般伺服器 (叢集軟體備援) 安裝 OS、DB、RAC安裝作業
僅需安裝1套系統,系統會自動同步至另一模組。 需安裝2套系統,需花費2倍以上之作業時間。並需額外設定。 叢集設定及測試 採用硬體容錯,沒有任何的額外設定。 需進行各軟體的叢集設定及測試,且可能過程會有失敗狀況造成額外成本。 演練 定期演練作業(每年2次) 採用硬體容錯,僅需將正在運行模組中斷,機器自行切換自另一模組持續運轉,簡易完成備援演練。 演練後將模擬障礙之模組開啟,即可恢復正常運轉狀態。 進行障礙演練、切換、模擬等作業需耗費大量人力資源。 演練完成後,需進行環境恢復作業,需確認各系統有無恢復正常運作。 維運 硬體障礙發生時處理成本 NEC FT系統仍可維持順利運作,不需任何人力介入,僅需通知NEC硬體更換作業,過程不需停機。 叢集軟體及資料庫於硬體障礙時,雖切換至可運行之硬體,但會影響效能且有可能造成系統停機維護。

30 4.實際案例分享

31 4.1「Express5800/FT Server」 導入實績(日本)
活躍在各行各業的高容錯伺服器 Express5800/FT伺服器導入企業 業種別實績和適用業務(日本) 其他 〔服務業〕  ・販賣管理   ・EDI    ・預約/客服系統 〔製造/流程〕  ・生産管理    ・物流管理   ・製品資訊管理 〔通信・媒體〕  ・內容管理    ・通信控制 〔醫療〕  ・電子病歷  ・醫院資訊系統   ・醫藥系統 〔金融〕  ・印鑑系統    ・換匯資訊  ・商品資訊管理 FT伺服器不止在日本國內, 在全球也有許多實際案例! 〔政府公單位/財團法人/文教〕  ・戸籍管理/居民資訊  ・公共費用管理 〔流通/零售〕  ・販賣管理  ・自動倉庫  ・EDI    上市以來 17000台以上的出貨實績 (Express5800/FT伺服器2001年度~2015年度日本國內出貨量統計 )

32 4.2 台灣實際案例分享

33 無 使用期間因為硬體錯誤造成 的系統停頓次數 國內大型商業銀行 4.3 一次建置一勞永逸 維運成本最低 設備投資效益最高
建置時間:2004年 至今超過十年 汰換原因:作業系統停止支援 保管箱系統 使用期間因為硬體錯誤造成 的系統停頓次數 維運成本最低 設備投資效益最高 2016年度已採購新型FT Server

34 國內知名交易中心 4.4交易連線不中斷 已往使用一般伺服器,曾經發生交易所連線期間,系統因備援機制啟動切換而造成停頓 報價主機 交易所主機
導入NEC FT Server 成功解決同地備援問題 交易員端末

35 國內知名證券商 只有NEC FT Server 能做到! 4.5前端客戶服務不中斷
Web網路下單 網路下單/憑證主機 只有NEC FT Server 能做到! 目標:為了提供客戶能全時進行網路/APP交易,期望能不受到系統錯誤影響前端客戶服務,並降低IT人員維護的困難 除了網路交易主機以外, 目前已導入共12台 FT Server

36 國內大型商業銀行 4.6 更聰明的IT投資 Oracle DB RAC 一般X86伺服器 FT伺服器 同樣的HA概念
少投資一半以上的License Oracle DB RAC 一般X86伺服器 FT伺服器 Oracle DB License計算方式 X86平台:1core=1/2core計價 12C CPU x2 一台(FT視為單台主機) 共 12Core License 不需Cluster License Oracle DB License計算方式 X86平台:1core=1/2core計價 12C CPU x2 兩台 共 24Core License RAC Cluster License另計

37


Download ppt "NEC Express5800 Fault Tolerant Server Introduction"

Similar presentations


Ads by Google