Download presentation
Presentation is loading. Please wait.
1
教材:《TMS320C55x DSP应用系统设计》 (第3版)
电话: ; 微信: jnliuzg 山东大学生物医学工程
2
网站: http://course.sdu.edu.cn/G2S/dsp.cc http://www.ti.com 网站资料, 例:
任课教师:刘忠国 电话: ; 微信: jnliuzg ; 网站: 网站资料, 例: TMS320C55x DSP CPU Reference Guide-SPRU371F-2004年版.pdf TMS320VC5509A Fixed-Point Digital Signal Processor-Data Manual-SPRS205K-2008年版.pdf
3
关于考核 成绩考核方式: 期末考试(开卷80%)+平时成绩(20%) 平时成绩包含: 考勤,作业,上课提问,实验
4
课程主要内容 第1章 绪 论 第2章 TMS320C55x的硬件结构 第3章 集成开发环境(CCS5.4)
第1章 绪 论 第2章 TMS320C55x的硬件结构 第3章 集成开发环境(CCS5.4) 第4章 TMS32055X的指令系统 第5章 TMS320C55x汇编语言编程 第6章 C/C++语言程序设计 第7章 应用程序设计 第8章 C55x的片上外设 第9章 C55x的硬件扩展 第10章 C55x应用系统设计实例
5
第1章 绪 论 本章内容提要: 主要对数字信号处理器(DSP, Digital Signal Processor )进行简要介绍。
6
1.1 DSP的基本概念 一个典型的数字信号处理系统 微处理器是数字信号处理系统的核心部件,通常采用DSP芯片,也可采用其它处理器芯片
A/D与D/A转换器建立起了数字世界与现实模拟世界之间的桥梁。
7
1.1 DSP的基本概念 DSP的含义 数字信号处理(Digital Signal Processing)
数字信号处理的理论和算法 数字信号处理器(Digital Signal Processor) 实现数字信号处理算法的微处理器芯片
8
一个典型的数字信号处理算法—FIR滤波器
乘与累加(MAC)是数字信号处理中的典型计算 数字信号处理的特点 灵活 精确 重复性好
9
数字信号处理系统中 微处理器的选择 优点:编程容易,便于实现 缺点:速度慢、成本高、体积大,难以进行实时信号处理和嵌入式应用
通用微型计算机(PC机) 普通单片机(如MCS-51、96系列等) 用专用集成电路(ASIC) DSP处理器 优点:成本低廉 缺点:性能差、速度慢 优点:速度高、大规模生产成本低; 缺点:开发成本高、通用性差。 针对数字信号处理的要求而设计,是数字信号处理系统设计中采用的主流芯片。 优点:灵活、高速、便于嵌入式应用
10
1.2 DSP芯片简介 1.2.1 DSP芯片的发展历史、现状和趋势 1.2.2 DSP芯片的特点 1.2.3 DSP芯片的分类
11
1.2.1 DSP芯片的发展历史、现状和趋势 1. DSP芯片的发展历史 诞生于20世纪70年代末
1978年,AMI公司生产出第一片DSP芯片S2811 1979年,美国Intel公司推出商用可编程器件DSP芯片Intel2920 1980年,日本NEC公司推出μPD7720, 第一片具有乘法器的商 用DSP芯片 1982年,TI公司成功推出其第一代DSP芯片TMS32010及其系 列产品TMS32011、TMS320C10/C14 /C15/C16/C17
12
第一阶段,DSP的雏形阶段(1980年前后) 1982 年, 日本Hitachi公司第一个采用CMOS工艺 生产浮点DSP芯片 1983年,日本Fujitsu公司推出的MB8764,指令 周期为120ns,具有双内部总线,使数据吞吐量 发生了一个大的飞跃 1984年,AT&T公司推出DSP32,是较早的具备 较高性能的浮点DSP芯片
13
第二阶段,DSP的成熟阶段(1990年前后) 硬件结构: 更适合数字信号处理的要求, 能进行硬件 乘法和单指令滤波处理, 其单指令周期为80~100ns。 如: TI公司的TMS320C20和TMS320C30, CMOS 制造工艺,存储容量和运算速度成倍提高,为语音 处理、图像处理技术的发展奠定了基础。 主要器件有:TI公司的TMS320C20、30、40、50系 列,Motorola公司的DSP5600、9600系列,AT&T 公司的DSP32等。
14
第三阶段,DSP的完善阶段(2000年以后) 信号处理能力更加完善,而且使系统开发更加方 便、程序编辑调试更加灵活、功耗进一步降低、 成本不断下降 各种通用外设集成到片上,大大地提高了数字信 号处理能力 DSP运算速度可达到单指令周期10ns左右,可在 Windows 下用C语言编程,使用方便灵活 广泛应用:通信、计算机领域,并渗透到日常消 费领域
15
2. DSP芯片的 发展现状 制造工艺 存储器容量 内部结构 运算速度 高度集成化 开发工具 运算精度和动态范围
普遍采用0.25μm或0.18μm亚微米的CMOS工艺。引脚从原来的40个增加到200个以上, 需设计的外围电路越来越少,成本、体积和功耗不断下降。 2. DSP芯片的 发展现状 芯片的片内程序和数据存储器可达几十K字,而片外程序存储器和数据存储器可达16M×48位和4G×40位以上。 制造工艺 存储器容量 内部结构 运算速度 高度集成化 运算精度和动态范围 开发工具 芯片内部均采用多总线、多处理单元和多级流水线结构,加上完善的接口功能,使DSP的系统功能、数据处理能力和与外部设备的通信功能都有了很大的提高。 指令周期从400ns缩到10ns以下,速度从2.5MIPS提到2000MIPS以上。TMS320C6201执行1024点复数FFT运算时间只有66uS。 集滤波、A/D、D/A、ROM、RAM和DSP内核于一体的模拟混合式DSP芯片已有较大的发展和应用。 DSP字长从8位已增到64位,累加器长度也增到40位, 提高了运算精度。同时,采用超长字指令字(VLIW)结构和高性能浮点运算,扩大了数据处理的动态范围。 有完善的软件和硬件开发工具:软件仿真器Simulator、在线仿真器Emulator、 C编译器和集成开发环境CCS等,给开发应用带来方便。CCS是TI公司针对本公司的DSP产品开发的集成开发环境。它集成了代码编辑、编译、链接和调试等功能,且支持C/C++和汇编的混合编程。开放式结构允许外扩用户自身的模块。
16
3. DSP技术的发展趋势 DSP的内核结构将进一步改善 DSP和微控制器的融合 DSP和高档CPU的融合
DSP 和FPGA、CPLD的融合 实时操作系统RTOS与DSP的结合 DSP的并行处理结构 功耗越来越低
17
1.2.2 DSP 芯片的特点 采用哈佛结构 采用多总线结构 采用流水线结构 支持并行指令操作 支持多处理器结构
程序存储器和数据存储器分开,有各自独立的程序总线和数据总线,可独立编址和独立访问。 可同时进行取指令和多个数据存取操作,使CPU在一个机器周期内可多次对程序空间和数据空间进行访问, 大大地提高了DSP的运行速度。 采用哈佛结构 采用多总线结构 采用流水线结构 配有专用的硬件乘法-累加器 具有特殊的寻址方式和指令 支持并行指令操作 硬件配置强,具有较强的接口功能 支持多处理器结构 时钟 取指令 指令译码 取操作数 执行指令 T1 T2 T3 T4 N N-1 N-2 N-3 N+1 N+2 N+3 四级流水线操作 在单指令周期内完成数字信号处理中用得最多的乘法-累加运算
18
1.2.3 DSP芯片的分类 按照数据格式 定点、浮点 按照字长大小 16位、24位、32位 按照不同生产厂家的产品系列
TI公司的TMS320系列 ADI公司的Blackfin、SHARC、TigerSHARC系 列 飞思卡尔公司的MSC系列等
19
1.2.4 DSP芯片的应用领域 信号处理 通信 语音 军事 医疗 图形与图像 仪器仪表 自动控制 家用电器 汽车
20
1.2.5 选择DSP芯片考虑的因素 运算速度 指标: MAC、FFT、MIPS、MOPS、MFLOPS、 BOPS 价格 硬件资源
片内RAM、ROM数量,可扩展程序和数据空间,接口 等 运算精度(字长) 定点:一般16位,少数24位 浮点:一般32位,累加器为40位 开发工具 功耗 其他因素 Million Instructions Per Second Billion Operations Per Second
21
1.3 DSP芯片产品简介 1.3.1 TI公司的DSP芯片概况 1.3.2 其它公司的DSP芯片概况
1.3.3 TMS320C5000概况
22
1.3.1 TI公司的DSP芯片概况 经典产品 目前主流系列
TMS320C1X、TMS320C25、TMS320C3X/4X、 TMS320C5 X、TMS320C8X(多处理器DSP) 目前主流系列 TMS320C2000,用于数字化控制领域 TMS320C5000,用于通信、便携式应用领域 TMS320C6000,音视频技术、通信基站 定点DSP 浮点DSP
23
1.3.2 其它公司的DSP芯片概况 ADI(Analog Devices, Inc.)公司的DSP芯片
代表系列有:ADSP Blackfin系列,ADSP TigerSharc系列,ADSP Sharc系列,Sigma DSP系列。 ADI提供了Visual DSP++编程环境,可以支 持软件人员进行开发调试。 飞思卡尔(FreeScale)公司的DSP芯片 飞思卡尔DSP产品包括采用StarCore技术的MSC系列和采用Symphony技术的DSP56x系列。
24
1.3.3 TMS320C5000概况 为16位定点整数 DSP处理器 迄今已有三代产品,即:
TMS320C5x、TMS320C 54x和TMS320C55x 同代产品具有相似的CPU结构和不同的片上存 储器和外围电路 存储器、外围电路与CPU集成在一个芯片上, 构成了一个单片计算机系统,降低整个系统的 成本、体积,提高可靠性
25
TMS320 C54x概况 采用改进Harvard结构 CPU结构 192K字的存储空间 片上外围电路 典型指令周期
1组程序读总线; 1组程序地址总线 2组数据读总线; 1组数据写总线 3组数据地址总线 1个40位的算术逻辑单元(ALU) 一个40位的筒形移位寄存器 2个独立的40位累加器 1个乘加器(MAC)单元 1个用于Viterbi计算的比较、选择、存储(CSSU)单元 1个指数编码器; 2个地址发生器单元 采用改进Harvard结构 CPU结构 192K字的存储空间 片上外围电路 典型指令周期 64K字程序存储空间,某些芯片有扩展程序存储空间 64K字的数据存储空间;64K字I/O接口空间 软件可编程等待状态发生器 可编程分区转换逻辑电路 带内部振荡器或外部时钟源的片内锁相环发生器 全双工操作的串行口 带4位预定标器的16位可编程定时器 主机并行接口(HPI) 外部总线控制等 25ns、12.5ns、10ns,对应的速度分别达到40MIPS、80MIPS、100MIPS
26
2. TMS320C55x概况 为C5000系列的最新一代产品,与C54x的源代码兼容。 与C54x相比 处理速度明显提高、功耗明显降低;
在结构上复杂的多,采用近似“双CPU结构”。 如300MHz的C55x与120MHz的C54x相比,C55x的处理速度比C54x提高了5倍, 功耗降到只有C54x的1/6。
27
表1-1 C55x与C54x的比较 C54x C55x MAC 1 2 累加器 4 读总线 3 写总线 程序取指(总线) 地址总线 6
程序(指令)字长 16位 8/16/24/32/40/48位 数据字长 辅助寄存器ALU 2(每个16位) 3(每个24位) ALU 1(40位) 1(40位), 1(16位) 辅助寄存器 8 数据寄存器 存储器空间 分开的程序/数据 统一的空间 寻址数目对应保证高速并行操作 separate auxiliary register arithmetic unit (ARAU0 and ARAU1) TMS320C55x Technical Overview (SPRU393)-23页
28
2. TMS320C55x概况 C5503/6/7/9A (主频200MHz, McBSP, HPI, USB1.1接口) ,
C5501/2(主频300MHz, McBSP,HPI接口), C5503/6/7/9A (主频200MHz, McBSP, HPI, USB1.1接口) , C5510 (主频200MHz, McBSP,HPI接口, 片上存储320KB) , C5504/05/14/15 (主频120/150MHz, McBSP, HPI, USB1.1接口) ,
29
补充:TI DSP具体型号的含义 VC 5509 PGE 5501 5502 5507 5510 5514
PGE━144引脚塑料LQFP VC━低电压CMOS(内核电压1.2,-1.6V,I/O口电压3V )
30
补充: DSP的开发平台 补充:开发工具 目标板 仿真器
31
补充: CCS的版本 教材所讲 CCS的旧版本: CCSv6.2.0 CCSv5.5.0 CCSv5.4.0 CCSv5.3.0
安装软件名称 软件版本 可以开发的TI DSP芯片 CCS3.3.exe 3.3 除TI 3000系列以外的DSP CCS3.1.exe 3.1 CCS2000.exe 2.21 F24X、F20X、LF24XXA、F28XX CCS5000.exe 2.20 VC54XX、VC55XX C FULL-to-C FULL.exe CCS6000.exe C6X0X, C6X1X, C6416 C FULL-to-C FULL.exe C6X0X,C6X1X,C6416,DM642
32
DSP的开发平台 TMS320C5509
33
DSP教学实验箱 (北京瑞泰创新)
35
VC5509-A评估板接口说明实物图
36
VC5509-A器件布局图
39
液晶控制板 V60型
40
V62型(实验室购买)
41
V80型
Similar presentations