China National Conference Center, Beijing 中国高性能计算机的发展趋势分析与展望 从中国TOP100排行榜谈起 State-of-the-Art Analysis and Perspectives of China HPC Development: A View from 2010 HPC TOP100 张云泉(Yunquan Zhang) 中科院软件所并行软件与计算科学实验室 计算机科学国家重点实验室 合作者:孙家昶 袁国兴 张林波 zyq@mail.rdcps.ac.cn 40th IDC HPC User Forum 2010 China National Conference Center, Beijing 2010年10月30日
中国HPC TOP100排行榜 2002年国内首次推出的高性能计算机排行榜,经过8年 的运作,已成为大陆高性能计算机排行方面事实上的工 业标准,得到广大研究人员,用户、厂商和政府部门的 认可。成为很多用户购买高性能计算机的重要参考和评 标依据,并被学术报告和项目申请引用。 2004年获得国家863“高性能计算机及其核心软件重大 专项”专家组的认可,获得其子项目《高性能计算机性 能测试技术及方法研究》的资助,被纳入该项目所成立 的“高性能计算机评测中心”的研究工作。2007年继 续获得滚动资助。 以该排行榜内容为依据编写的分析报告,2005、2006、 2007三年入选中国计算机学会学术工委编写的年度 《中国计算机科学技术发展报告》。 以此为契机于2004年创办的“全国高性能算法软件研 究开发研讨会”已成功举办6届,成为系列会议。2007 年到会人数超过130人。成为HPC产业界的年度盛会。 2004年,美国SCIDAC计划TOPS PI David Keyes以 TOP100排行榜为基础,对中国的HPC发展情况进行分 析和研究,并做了《Supercomputing in China》报告。 排行榜英文版内容每年都和TOP500负责人Hans Meuer和Jack Dongarra教授等进行交流. 日前TOP500网站与国内TOP100网站互相交换了链接, TOP500以新闻的形式报道了中国TOP100. 协会2007和2010年收到美国国家自然基金委资助的 Supercomputing Workshop的特邀报告邀请,专门向 美国科学家介绍中国大陆TOP100的发展和趋势。
2010年中国高性能计算机性能TOP100排行榜 张云泉 孙家昶 袁国兴 张林波 中国软件行业协会数学软件分会 国家863高性能计算机评测中心 中国计算机学会高性能计算专业委员会 (http://www.samss.org.cn) 本排行榜为中国软件行业协会数学软件分会、国家863高性能计算机 评测中心和中国计算机学会高性能计算专业委员会联合公开发布的 2010年中国高性能计算机性能TOP100排行榜,版权属于中国软件行 业协会数学软件分会(http://www.samss.org.cn),欢迎各方提供准确 信息。引用者需要注明出处;用于商业目的者,须经中国软件行业协 会数学软件分会许可。 联系人:张云泉 博士。(zyq@mail.rdcps.ac.cn 或者 samss@mail.rdcps.ac.cn)。 本排行榜得到国家863“高效能计算机及网格服务环境”重大专项课题, 《高效能计算机系统测评技术研究》( No.2006AA01A105)的资助。
2010年中国高性能计算机性能TOP100排行榜 注解1: 本排行榜的Linpack数据只包括中国大陆地区,有如下几个来源: 来源标为“Q”的Linpack数据是经过本协会测试、抽查的数据或部级鉴定会认可的数据; 来源标为“T”的Linpack数据是从国际TOP500(http://www.top500.org)公布的数据引用来的; 来源标为“C”的Linpack数据是机器制造商提供的数据; 来源标为“U”的Linpack数据是根据商业公司的公开数据、用户填写的调查表的数据给出; 由用户/厂商填写的数据,本协会只负责对其合理性进行检查,其真实性由填写调查表的用户/厂商负责; 根据人力和物力的情况,本协会将适当加大由协会参与测试的数据的比例; 来源标为“S”的Linpack数据是从国际TOP500(http://www.top500.org)公布的同型号高性能计算机系统较大规模机器的Linpack值等比推算出来的。
注解2: 2010年中国高性能计算机性能TOP100排行榜 各系统的峰值数据主要根据用户/厂商填写的调查表中数据给出。本协会只负责对其合理性进行检查,其真实性由填写调查表的用户/厂商负责; 本排行榜将至少在每年10月底或11月上旬公布一次; 调查和整理过程中,难免出现疏漏和错误,欢迎对调查表中的问题提出您的意见,请将反馈意见发到:samss@mail.rdcps.ac.cn;联系人:张云泉 博士(zyq@mail.rdcps.ac.cn)。
2010 China HPC TOP10 排名 厂商 型号 安装地点 年份 应用领域 处理器核 Linpack (Gflops) 来源 Peak (Gflops) 效率 1 国防科大 天河一号A/7168x2 Intel Hexa Core Xeon X5670 2.93GHz + 7168 Nvidia Tesla M2050@1.15GHz+2048 Hex Core FT-1000@1GHz/私有高速网络80Gbps 国家超级计算天津中心 2010 科学计算/工业 202752 2507000.00 Q 4701000.00 0.533 2 曙光 曙光星云/Dawning TC3600 Blade/Intel Hexa Core X5650 + Nvidia Tesla C2050 GPU/QDR Infiniband 曙光天津产业基地 120640 1271000.00 C 2984300.00 0.426 3 中科院过程所 Mole-8.5 Cluster/320x2 Intel QC Xeon E5520 2.26 Ghz + 320x6 Nvidia Tesla C2050/QDR Infiniband 中国科学院过程工程研究所 科学计算/粒子模拟 33120 207300.00 1138440.00 0.182 4 魔方/曙光5000A/1920x4 AMD QC Barcelona 1.9GHz/DDR Infiniband/WCCS+Linux 上海超级计算中心 2008 30720 180600.00 233472.00 0.774 5 联想 深腾7000/1240x2 Intel Xeon QC E5450 3.0GHz/140x4 Intel Xeon QC X7350 2.93GHz Infiniband 4xDDR 中国科学院超级计算中心 科学计算 12160 106500.00 145293.00 0.733 6 曙光星云/Dawning TC3600 Blade/220x(2 Intel Hexa Core X5650 + 1 NVidia Tesla C2050)/QDR Infiniband 成都超级计算中心(二期) 5720 76350.38 141389.60 0.540 7 生物专用机/Dawning TC3600 Blade/Intel Hexa Core X5650 + NVidia Tesla C2050 GPU/QDR Infiniband 中国科学院计算技术研究所 生物信息学 4160 55527.55 102828.80 8 IBM xSeries x3650M2 Cluster/Intel Xeon QC E55xx 2.53 Ghz/Giga-E 工程公司 工业 8960 51200.00 T 90680.00 0.565 9 HP Cluster Platform 3000 BL460c G6/Intel Xeon E5540 2.53 GHz/Giga-E 中国电信 电信 7848 41880.00 79420.00 0.527 10 BladeCenter HS22 Cluster/Intel Xeon QC GT 2.53 GHz/Giga-E 网络公司 2009 工业/游戏 7168 41270.00 72540.00 0.569
2010 China HPC TOP100 No.11-No.20 排名 厂商 型号 安装地点 年份 应用领域 处理器核 Linpack (Gflops) 来源 Peak (Gflops) 效率 11 IBM BladeCenter HS22 Cluster/Intel Xeon QC GT 2.53 GHz/Giga-E 网络公司 2009 工业/游戏 7168 41270.00 T 72540.00 0.569 12 13 曙光 曙光星云/Dawning TC3600 Blade/710xIntel Hexa Core X5650 + 78x NVidia Tesla C2050/QDR Infiniband 北京市计算中心(二期) 2010 科学计算/工业 3660 38527.44 C 79112.40 0.487 14 xSeries x3650M2 Cluster/Intel Xeon QC E55xx 2.53 Ghz/Giga-E 服务提供商 工业 6400 36940.00 64770.00 0.570 15 16 6120 35330.00 61930.00 17 HP Cluster Platform 3000 BL480c/Intel Xeon 5405 2Ghz/GigE 电信公司 电信 8296 34936.60 65750.00 0.531 18 浪潮 TS10000/300x2 Intel Xeon Hexa Core X5650 2.66GHz/QDR Infiniband 吉林大学 科学计算/教育 3800 34080.00 40094.00 0.850 19 Cluster Platform 3000 DL160/Intel Xeon Hexa Core E5650 2.66G/Giga-E+DDR Infiniband 中国石油东方地球物理勘探有限公司 能源/地球物理 4500 32079.00 47880.00 0.670 20 IBM BladeCenter HS22 Cluster/400x2 Intel Xeon 5550 2.66GHz/Infiniband 南京大学 3200 31310.00 34048.00 0.920
2010 China HPC TOP100 No.21-No.30 排名 厂商 型号 安装地点 年份 应用领域 处理器核 Linpack (Gflops) 来源 Peak (Gflops) 效率 21 曙光 曙光5000/420x2 Intel Quad Core 3.0GHz/DDR Infiniband 计算物理国家重点实验室 2009 科学计算 3360 31048.80 C 40320.00 0.770 22 IBM BladeCenter HS22 Cluster/Intel Xeon QC GT 2.53 GHz/Giga-E 网络公司 工业/游戏 5376 31030.00 T 54410.00 0.570 23 24 25 26 HP Cluster Platform 3000 BL460c G1/Intel Xeon L5420 2.5 GHz/Gig-E 后勤服务 工业 5840 31029.10 58400.00 0.531 27 xSeries x3650M2 Cluster/Intel Xeon QC E55xx 2.53 Ghz/Gig-E 电信公司 2010 5104 29460.00 51650.00 28 BladeCenter HS22 Cluster/ Intel Xeon QC X55xx 2.66 GHz/Giga-E 工程公司 5040 29090.00 51000.00 29 4928 28450.00 49870.00 30 Cluster Platform 3000 BL460c/Intel Xeon E54xx 2.33 GHz/Giga-E 2008 电信 5584 27678.00 52042.90 0.532
2010 China HPC TOP100 No.31-No.40 排名 厂商 型号 安装地点 年份 应用领域 处理器核 Linpack (Gflops) 来源 Peak (Gflops) 效率 31 曙光 曙光5000/AMD Opteron Quad Cores 2.4 GHz/Giga-E 政府部门 2010 4928 25272.83 C 47308.80 0.534 32 IBM IBM Cluster BladeCenter HS22/740x2 Intel QC E5506 2.13GHz/Giga-E 5920 25000.00 50440.00 0.496 33 BladeCenter HS21 Cluster/630x2 Intel Xeon E5430 Quad Core 2.66GHz/Giga-E 中石油四川石油物探公司 2008 能源/地球物理 5040 24670.00 53625.60 0.460 34 HP Cluster Platform 3000 BL460c/Intel Xeon E5530 2.4G + Xeon 5550 2.66G/DDR Infiniband 中国科学院大气物理研究所 2009 大气气象 2896 24537.00 28866.56 0.850 35 DELL PowerEdge M605 Blade/360x2 AMD Hexa Core 2435 2.6GHz/ Giga-E 华大基因深圳研究院 生物信息 4320 23400.00 44928.00 0.521 36 Cluster Platform 3000 BL460c/384x2 Intel Xeon E5430 Quad Core 2.66GHz/ Infiniband 20Gb/s 中国地震局工程力学研究所(北京) 科学计算/地震工程 3072 23272.00 U 32686.08 0.712 37 BladeCenter HS21 Cluster/558x2 Intel Xeon E5430 Quad Core 2.66GHz/Giga-E 中石油大庆物探公司 4464 22140.00 T 47620.00 0.465 38 浪潮 TS10000/288x2 Intel Xeon QC X5550/DDR Infiniband 中国科学院数学与系统科学研究院 科学计算 2256 21470.00 24003.00 0.894 39 IBM BladeCenter LS22 Cluster/256x2 AMD Opteron Istanbul 2431 2.4GHz/10GE 中国石油大学(北京) 20643.84 29491.20 0.700 40 宝德 PowerScale 8000/512x Intel Harpertown Xeon Quad Core 3.0GHz(X5450)/Infiniband 湖南 2048 20410.00 24576.00 0.830
2010 China HPC TOP100 No.41-No.50 排名 厂商 型号 安装地点 年份 应用领域 处理器核 Linpack (Gflops) 来源 Peak (Gflops) 效率 41 宝德 PowerScale 8000/568xIntel Tigerton Xeon Quad Core 2.93GHz(X7350)/Infiniband DDR 4X 江苏 2008 科学计算 2272 19970.00 C 26627.00 0.750 42 曙光 曙光5000/Intel Xeon Quad Cores 2.33/2.66 GHz/Giga-E 电视台 2010 工业/视频计算 4304 19589.52 36670.08 0.534 43 曙光5000/Intel Xeon Quad Cores 2.4 GHz/Giga-E 网络公司(北京) 工业/互联网 3600 19111.68 34560.00 0.553 44 国家并行计算机工程技术研究中心 神威3000A/242 x 2 Intel Xeon Quad Core E5472 3.0GHz/DDR Infiniband 北京 2009 大气气象 1936 19070.00 23232.00 0.821 45 IBM IBM BladeCenter HS21 Cluster, Intel Xeon 51xx(Woodcrest) dual core 2.33 GHz/Giga-E 中石化胜利油田分公司物探研究院地球物理研究所 2007 能源/地球物理 4096 18600.00 T 38223.90 0.487 46 HP Cluster Platform 3000 BL460c G1/Intel Xeon L5405 2 GHz/Giga-E 电信公司 电信 4336 18534.80 34688.00 0.534 47 BladeCenter HS21 Cluster/506x2 Intel Xeon Quad Core 2.33GHz/Giga-E 中石油东方地球物理公司 4048 18146.86 37727.36 0.481 48 曙光5000/AMD Opteron Quad Cores 2.4 GHz/Giga-E 科研机构(上海) 政府部门 3568 17853.63 34252.80 0.521 49 3360 17837.57 32256.00 50 Cluster Platform 3000 BL460c G1, Xeon 5430 2.66 GHz/Giga-E 电信公司(北京) 3096 17680.00 32941.44 0.537
2010年10月15日,数学软件分会孙家昶、袁国兴和张云 泉等三人现场考察国防科技大学研制成功的千万亿次超 级计算系统“天河一号A”
2010年10月23日, 国际TOP500作者之一 、美国田纳西大学Jack Dongarra教授和Beowulf之父LSU Thomas Sterling教授、数学软件分会副理事长迟学斌 研究员、秘书长 张云泉 研究员等现场考察天河1A
中国TOP100性能分析(1) 中国TOP100的总Linpack性能6.23PFlops(2009 年2.2PFlops),2.83倍(2009年2.12倍); 2010年6月,TOP500排行榜第一名仍然被Cray 公司的Jaguar XT5-HE保持,Linpack性能 1.759PFlops; 但Roadrunner降为世界第三,第二名的位置被 曙光星云首次夺得, Linpack性能 1.206PFlops ; 国防科大以天河1A再次蝉联中国TOP100第一名, Linpack性能2.5PFlops,峰值4.7PFlops。 中国是否会历史性的夺得世界TOP500排行榜第 一,值得期待!
全部机器的Linpack性能超过9.6Tflops 全部系统的峰值超过11TFlops 中国TOP100性能分析(2) 全部机器的Linpack性能超过9.6Tflops 2009年6.8TFlops,1.41,比去年的2.04倍下滑。 全部系统的峰值超过11TFlops 2009年8.1TFlops,1.36倍,比去年的2.03倍下滑; 排名前三的机器全部是CPU+GPU异构机群。 共有98个(2008年96个)系统是机群。 机群继续占据主导地位。 前10名里5台是CPU+GPU异构机群。
Cluster Sharing Trends of China HPC TOP100 (2002 -2010)
中国TOP100制造商分析(1) 厂商 系统 份额 Rmax [TF/s] Rpeak [TF/s] 平均效率 (%) 处理器核 国产 机器 曙光 34 34% 2028.19 4218.89 61.07% 233436 浪潮 5 5% 92.11 115.38 78.30% 10360 联想 3 3% 126.69 182.27 50.83% 16128 神威 50.74 64.49 80.23% 6096 宝德 2 2% 40.38 51.20 79.00% 4320 国防科大 1 1% 2507.00 4701.00 53.30% 202752 中科院过程所 207.30 1138.44 18.20% 33120 国产小计 49 49% 5052.41 10471.67 60.13% 506212 引进 IBM 28 28% 753.01 1328.21 58.13% 133000 HP 19 19% 367.46 629.12 60.93% 65508 Dell 47.83 74.60 72.43% 6880 SUN 10.46 13.58 66.00% 1200 引进小计 51 51% 1178.76 2045.51 64.37% 206588 总计 100 100% 6231.17 12517.59 62.00% 712800
中国TOP100厂商份额趋势 21
中国TOP100制造商分析(2) TOP10中,曙光4台(No.2,4,6,7), IBM 2 台(No.8,10), 国防科大1 台(No.1),中科院过程所1台(No.3),联想1台(No.5)HP 1台 (No.9). 美国制造的机器数量仍然占装机数量的51%,比2009年的55%继续 小幅下降; 国产机器厂商有曙光、浪潮、联想、神威、宝德、国防科大和中科 院过程所等上榜,数量继续保持七家。国产机器(曙光公司)继续 保持中国TOP100数量份额第一名! 国外机器由5家下降为4家,IBM、HP、DELL和SUN。曙光公司 连续二年保持中国TOP100数量份额的第一名! 且份额大幅度上升! 共有十一家厂商上榜,但份额集中在曙光、IBM和HP等厂商! Linpack性能来看,国产机器的性能比例为81.08%%,比2009年的 59.31%大幅跃升。而国外机器从2009年的40.69 %,大幅下滑到 18.92%。跨越式发展! 国防科大连续两年保持中国TOP100冠军和总性能份额第一名! 国外机器的数量优势丧失殆尽,国产机器在总性能上远远超过国外 机器,有4.3倍的优势。
中国TOP100制造商机器数量份额图
中国TOP100制造商机器性能份额图
中国TOP100行业领域分析(1) 能源 17 17% 265508.07 467189.50 59.07% 46100 工业 15 15% 应用领域 数量(套) 份额 Linpack[GF/s] 峰值 [GF/s] 平均效率 处理器数 能源 17 17% 265508.07 467189.50 59.07% 46100 工业 15 15% 4299853.48 8516574.64 70.76% 401324 科学计算 12 12% 476779.40 1491403.64 73.83% 64376 游戏 9 9% 291100.00 517130.00 55.76% 51136 政府部门 138162.97 266433.60 52.07% 29096 电信 7 7% 187450.40 348690.34 53.84% 37360 教育 129689.42 167107.76 77.94% 13624 气象 5 5% 85589.00 115121.52 74.62% 12192 生物信息 4 4% 100894.55 178611.80 63.03% 10864 互联网 88469.25 163946.00 53.40% 16600 后勤服务 2 2% 43939.10 81960.96 53.95% 8368 地震 37372.00 50066.08 76.15% 4608 视频计算 31507.37 58988.16 6608 电力 21726.15 38752.00 56.15% 4240 动漫渲染 1 1% 12115.26 22131.20 54.70% 2080 物联网 11095.04 20377.60 54.40% 2176 金融保险 9830.25 13107.00 75.00% 2048 总计 100 100% 6231171.71 12517591.80 62.00% 712800
中国TOP100行业领域分析(2) 主要分布在能源 、工业、科学计算、游戏、政府部门、 电信、教育、大气气象、生物信息、互联网、后勤服 务、地震、视频计算、电力、动漫渲染、物联网和金 融保险等十七个领域。领域数量有所增加。 从机器数量上,能源(17%,去年20%,继续小幅下 滑,保持第一)、工业(15%,保持第二)科学计算 (12%,小幅下滑,保持第三)。 从机器Linpack性能上看,工业(69.01%,大幅提升 保持第一),科学计算(7.65%,2009年12.21%,份 额继续下降),游戏(4.67%,份额大幅下滑)。 综合来看,能源、工业、科学计算、游戏和政府部门 等是高性能计算主要用户。 物联网、互联网和电力等作为新应用领域在中国 TOP100上首次出现。
中国TOP100应用领域趋势 27
中国TOP100行业应用领域机器系统份额图
中国TOP100行业应用领域机器性能份额图
中国TOP100多核处理器系统份额图
中国TOP100处理器制造商系统份额图
中国TOP100互联网络系统份额图
中国TOP100性能发展趋势
趋势和展望(1) 综合从1993年开始的中国国产公开高性能计算 机当年性能最高机器峰值性能,我们得到了图 中的中国高性能计算机性能发展趋势图 (1993-2010)。 中国高性能计算机从1993年到1996年发展平稳(3年),没有量级变化; 从1996年开始(曙光1000)到1999年(神威I)实现了第一次跨越式发展(3年); 从1999年到2001年又进入平稳发展期(2年); 从2001年开始(曙光3000)到2005年,进入另外一次快速发展时期,(曙光4000A,深腾6800,国家气象局21万亿次机器)(4年); 从2004年2007年,重新进入平稳发展期(3年) 平稳期在2008年结束,开始进入另外一个活跃发展周期,大约会持续2到3年。 34
趋势和展望(2) 从TOP100性能趋势预测可以看出: 峰值100TFflops的机器将在2007年到2008年间出现(2008年10月); 累计Linpack性能将在2008年到2009年间超过Petaflops(2008年10月); 峰值Petaflops的机器将在2010年到2011年间出现(提前完成!); 峰值10Petaflops的机器将在2012年到2013年间出现; 累计Linpack性能将在2011年到2012年间达到10Petaflops; 峰值100Petaflops的机器将在2014年到2015年间出现; 累计Linpack性能将在2013年到2014年间达到100Petaflops。 35
谢谢. THANKS Q&A 请多提宝贵意见. 欢迎加入SAMSS和CCF 高专委 谢谢! THANKS Q&A 请多提宝贵意见! 欢迎加入SAMSS和CCF 高专委! 欢迎出席 HPC CHINA 2011 JINAN, SHANDONG HTTP://WWW.SAMSS.ORG.CN