基于压缩算法的tile64多核处理器性能研究

Slides:



Advertisements
Similar presentations
四川财经职业学院会计一系会计综合实训 目录 情境 1.1 企业认知 情境 1.3 日常经济业务核算 情境 1.4 产品成本核算 情境 1.5 编制报表前准备工作 情境 1.6 期末会计报表的编制 情境 1.2 建账.
Advertisements

主编:邓萌 【点按任意键进入】 【第六单元】 教育口语. 幼儿教师教育口 语概论 模块一 幼儿教师教育口语 分类训练 模块二 适应不同对象的教 育口语 模块三 《幼儿教师口语》编写组.
第一組 加減法 思澄、博軒、暐翔、寒菱. 大綱 1. 加減法本質 2. 迷思概念 3. 一 ~ 七冊分析 4. 教材特色.
第 3 章操作系统基础 3.1 操作系统概述 3.2 操作系统的功能模块 3.3 典型操作系统概述.
海南医学院附 院妇产科教室 华少平 妊娠合并心脏病  概述  妊娠、分娩对心脏病的影响  心脏病对妊娠、分娩的影响  妊娠合病心脏病的种类  妊娠合并心脏病对胎儿的影响  诊断  防治.
植树节的由来 植树节的意义 各国的植树节 纪念中山先生 植树节的由来 历史发展到今天, “ 植树造林,绿化祖国 ” 的热潮漫卷 了中华大地。从沿海到内地,从城市到乡村,涌现了多少 造林模范,留下了多少感人的故事。婴儿出世,父母栽一 棵小白怕,盼望孩子和小树一样浴光吮露,茁壮成长;男 女成婚,新人双双植一株嫩柳,象征家庭美满,幸福久长;
客户协议书 填写样本和说明 河南省郑州市金水路 299 号浦发国际金融中 心 13 层 吉林钰鸿国创贵金属经营有 限公司.
浙江省县级公立医院改革与剖析 马 进 上海交通大学公共卫生学院
第二章 环境.
產學攜手合作計畫 楊授印 國立虎尾科技大學 推廣教育中心 主任 動力機械工程系 助理教授 民國103年10月30日.
教师招聘考试 政策解读 讲师:卢建鹏
了解语文课程的基本理念,把握语文素养的构成要素。 把握语文教育的特点,特别是开放而有活力的语文课程的特点。
北台小学 构建和谐师生关系 做幸福教师 2012—2013上职工大会.
福榮街官立小學 我家孩子上小一.
第2期技職教育再造方案(草案) 教育部 101年12月12日 1 1.
企业员工心态管理培训 企业员工心态管理培训讲师:谭小琥.
历史人物的研究 ----曾国藩 组员: 乔立蓉 杜曜芳 杨慧 组长:马学思 杜志丹 史敦慧 王晶.
教育部高职高专英语类专业教学指导委员会 刘黛琳 山东 • 二○一一年八月
淡雅诗韵 七(12)班 第二组 蔡聿桐.
第七届全国英语专业院长/系主任高级论坛 汇报材料
小數怕長計, 高糖飲品要節制 瑪麗醫院營養師 張桂嫦.
制冷和空调设备运用与维修专业 全日制2+1中等职业技术专业.
会计信息分析与运用 —浙江古越龙山酒股份有限公司财务分析 组员:2006级工商企业管理专业 金国芳 叶乐慧 魏观红 徐挺挺 虞琴琴.
第六章 人体生命活动的调节 人体对外界环境的感知.
芹菜 英语051班 9号 黄秋迎 概论:芹菜是常用蔬菜之一,既可热炒,又能凉拌,深受人们喜爱。近年来诸多研究表明,这是一种具有很好药用价值的植物。 别名:旱芹、样芹菜、药芹、香芹、蒲芹 。 芹菜属于花,芽及茎类。
多核结构与程序设计 杨全胜 东南大学成贤学院计算机系.
2012年 学生党支部书记工作交流 大连理工大学 建工学部 孟秀英
北京市职业技能鉴定管理中心试题管理科.
2014吉林市卫生局事业单位招聘153名工作人员公告解读
各類所得扣繳法令 與申報實務 財政部北區國稅局桃園分局 103年9月25日
初級游泳教學.
爱国卫生工作的持续发展 区爱卫办 俞贞龙.
第八章 数学活动 方程组图象解法和实际应用
本课内容提要 一、汇率的含义 二、汇率变化与币值的关系 三、汇率变化的影响. 本课内容提要 一、汇率的含义 二、汇率变化与币值的关系 三、汇率变化的影响.
散文鉴赏方法谈.
日月光·伯爵居项目介绍.
比亚迪集成创新模式探究 深圳大学2010届本科毕业论文答辩 姓名:卓华毅 专业:工商管理 学号: 指导老师:刘莉
如何撰写青年基金申请书 报 告 人: 吴 金 随.
牡丹江旅游景点介绍.
香港故事之 三年零八個月的艱苦歲月 組員: 梁珮瑩 吳遠莉 李琪 李青儀 方松皓.
紓壓腹部撇步 彭易璟 老師 第10組 4A055935林資淳 4A155002詹柏廷 497C0095林千慈 498J3041 郭人慈.
我的故事 ————往事回首.
郭子光教授从肺肾虚损辨治早中期慢性肾功能不全的经验
教育部技職司 北區:2015年10月12日下午 南區:2015年10月16日下午
女生成功靠什么? 09英本四班 傅柏双.
国际投资环境罗氏评级法 美国.
TS-251A / TS-451A Turbo NAS 2016 Global Seminar 按一下以編輯母片標題樣式 絕佳靈活性!
社会保障学 第5章 失业保险.
主 题 班 会 团 结   协 作    力 量.
理想.
淘宝 商品库MySQL优化实践 QCon 2011 Beijing
固定与搬运技术 义乌市中心医院 陈红卫.
第6章 计算机网络基础.
操作系统结构.
Windows 2000/XP网络组建与系统管理 李燕 中南分校.
中鸣虚拟搜救比赛项目 (一人) 现场主题创作(40%)(一人) 3D虚拟搜救(60%)(一人).
案例分析 胎记美容记 第6小组
人生五色臉 年輕十歲必學的小動作,九個保持身體健康的的小訣竅 人們常在不經意間做些小動作,並認為這是身體的本能反應,
创办紫金矿业学院 为培养中国一流的矿业人才助力 ——合作创办紫金矿业学院的思路与实践
“服务器服务于Internet”报告会 倪光南 1999年7月6日
IP路由器.
電腦硬體基本介紹 國立高雄大學資訊工程學系 林士倫 2010/10/21.
CPU資料處理 醫務管理暨醫療資訊學系 陳以德 副教授: 濟世CS 轉
泛腾众核平台方案
實現雲端運算 Hadoop HDFS 磁碟及記憶體之即時分級服務
淘宝核心系统数据库组 余锋 利用新硬件提升数据库性能 淘宝核心系统数据库组 余锋
GPU分散式演算法設計與單機系統模擬(第二季)
Chapter 4 多執行緒 (Multi Thread)
基础信贷法律知识 讲解人:岳杨.
ADX series Configuration
Presentation transcript:

基于压缩算法的tile64多核处理器性能研究 马斯 朱科军 章红宇 中国科学院高能物理研究所 2011.07.01

Outline 研究计划要点及执行情况概述 研究工作主要进展和阶段性成果 下一阶段工作计划

研究计划要点 研究新型的粒子物理实验DAQ系统架构,建立基于高性能64核处理器芯片TILE64的处理平台,并进行软、硬件开发。软件部分主要内容是研究系统在多核处理器上的任务分配,以达到最高的效率。 预期目标:建立基于多核处理器的DAQ平台,实现3Gbps 以上的数据传输及处理,实现多核处理的优化配置。 具体的核心指标有: 单片处理器接收 > 3Gbps的数据输入 在3Gbps数据率条件下进行实时数据处理

研究计划执行情况 任务书研究计划: 目前计划完成情况: 2008.9-2009.8 ~2009.7 购买设备,并进行搭建平台的准备工作 2009.9-2010.8 实现TILE64 为核心的测试系统,进行系统性能的初步测试,编写软件进行CPU 间的任务平衡,实现两核运行 2010.9-2011.8 数据获取和处理程序编程,根据算法实现并行处理,具备系统级并行处理能力 2011.9-2012.8 编写软件,实现在3Gbps 的数据吞吐处理能力下进行数据的算法处理,并给出其它测试指标 目前计划完成情况: ~2009.7 完成设备购买和实验平台搭建 按计划完成 ~2010.8 完成多核开发培训、软件升级、技术文档阅读,多核系统并行程序开发的学习 2010.9-2011.4 基于多核处理器开发板,编写测试软件,实现了多核运行 开展了各项系统性能测试,进行了压缩算法、数据传输效率的研究; 基本按计划完成

基于嵌入式多核处理器的 数据传输和处理平台 硬件设备 Tilera Tile64 多核处理器开发板(The TILExpress card) integrate the Tile Processor, multiple I/O interfaces, expandable memory DELL 服务器(DELL PowerEdge SC440 Server) 英特尔奔腾双核处理器 E2180, 2GHz/1MB二级缓存/800MHz前端总线 Tile64处理器开发板插在DELL服务器主板PCIe插槽上 软件开发环境 Tile64 Linux version 2.6.26.7 多核系统集成开发环境(MDE):MDE-2.1.0.98943 DELL CentOS release 5.2 (Final) ;Linux version 2.6.18-92.el5

TILExpress Card Tilera Tile64 Multi-core Processor I/O Interfaces 2 XAUI, 2 PCIe, 2 GbE DDR2 Memory Speed 800MHz Processor Frequency 700MHz Number of Tiles 64 TILExpress Card

Tile64多核处理器简介 64 identical processor cores (tiles) interconnected with Tilera's iMesh™ on-chip network. Each tile is a complete full featured processor including integrated L1 & L2 cache and a non-blocking switch that connects the tile into the mesh. Each tile can independently run a full operating system, or multiple tiles taken together can run a multi-processing OS like SMP Linux. The TILE64 Processor is programmable in ANSI standard C and C++ Tilera's Multicore Development Environment (MDE)

研究工作主要进展和阶段性成果 系统性能测试 I/O性能测试 GbE性能测试 PCIe通道性能测试 基于压缩算法的tile64处理性能测试

I/O性能测试 - GbE 单独测试多核处理器板千兆网络性能 数据传输方式: 带宽测试结果如下: DELL服务器千兆网口,经过千兆交换机,连接到多核开发板千兆网口; 发送64Kbyte大小的数据包; TCP/IP协议 带宽测试结果如下: 发包速度:55MB/s 收包速度:36MB/s

I/O性能测试 – PCIe通道 服务器通过PCIe通道向板卡中传入数据 Tilera MDE API:Zero-Copy Command Queues  主要功能:允许高带宽的PCIe用于发送或接收缓冲区数据而不需要任何内存拷贝开销。 测试结果: 发包速度:110MB/s 收包速度:245MB/s

I/O性能测试 – PCIe通道 zero copy command queue 的带宽随着队列缓冲区的增大而增大。 由于Tile Linux页大小为64KB,因此测试中,buffer size 最大不能超过64KB。 当buffer size为64KB 时,单队列带宽达到最大,host->tile64为2000Mbps,tile64 ->host为900 Mbps。

I/O性能测试 – PCIe通道 在buffer size为64KB时,zero-copy command queue 个数增加到一定值时,总带宽不再增加。 当队列数为4的时候,host-tile64总带宽达到最大为3000Mbps,tile64-host为1100 Mbps。

数据文件压缩效率测试 测试方法1 从DELL服务器硬盘读取大小为2Gbyte的数据文件到多核开发板内存,采用不同数目的Tile处理器单元做压缩,压缩后的数据文件写入服务器硬盘。 读入线程 写出线程 压缩线程 程序开始执行时,申请(压缩线程数x2)个buffer,1顺序队列,(压缩线程数x2)个输出队列。线程间通过查询buffer的状态互相通信。 读入线程将数据从主机硬盘读到板卡的内存buffer中(fread); 每个压缩线程负责压缩两个确定buffer中的数据,将压缩后的数据放入输出队列; 写出线程顺序写出输出队列中的数据—从板卡内存fwrite到主机硬盘。 压缩算法:移植到tile6上的smp-mgzip 当压缩线程数为8的时候,压缩带宽达到最大,但仅为15MB/s

数据文件压缩效率测试 测试方法2 利用多核开发板千兆网口输入/输出数据文件 从开发板千兆网口输入2Gbyte的数据文件到多核开发板内存,采用不同数目的Tile处理器单元做压缩,压缩后的数据文件从千兆网口送出。 读入线程 写出线程 压缩线程 程序开始执行时,申请(压缩线程数x2)个buffer,1顺序队列,(压缩线程数x2)个输出队列。线程间通过查询buffer的状态互相通信。 读入线程采用C/S模式与服务器通信,由服务器向板卡buffer中读入数据; 每个压缩线程负责压缩两个确定buffer中的数据,将压缩后的数据放入输出队列; 写出线程将板卡内存中的数据通过网络写出到服务器 压缩算法:移植到tile6上的smp-mgzip 当压缩线程数为14的时候,压缩带宽达到最大,为26MB/s

瓶颈 Tile计算能力? 多CPU并行处理时开销太大? …… 优化算法? 优化Tile任务分配?

下一阶段工作计划 2011.5 – 2012.8 优化数据传输方案,提高千兆网口和PCIe通道数据吞吐能力; 将多核处理器上XAUI接口连接万兆口交换机,实现3Gbps 以上数据吞吐能力,满足考核指标; 基于64核处理器,进行在线数据处理能力的性能测试; 进行不同在线数据处理算法的研究。 波形数据积分 寻峰 ……

附录:基于本课题研究发表的论文 会议论文(投稿) 基于压缩算法的tile64多核处理器性能研究 马斯1,2,朱科军1,2,章红宇1,2   会议论文(投稿) 基于压缩算法的tile64多核处理器性能研究 马斯1,2,朱科军1,2,章红宇1,2 (1.中国科学院高能物理研究所,北京,100049; 2.中国科学院核探测技术与核电子学重点实验室,北京,100049)

The End Thank you!