数学基础及图像的基本概念 (研究生) 巫义锐 河海大学计算机与信息学院 个人网址:wuyirui.github.io 电子邮箱:wuyirui@hhu.edu.cn
如何下载课件 课件网站地址:wuyirui.github.io
时间表 11周周三:小作业,大作业确定题目;通过Email报名 12周周一:大作业演讲次序确定 12周周三:开始讲演(每位讲演完的同学,请将修改后的PPT发送至我的邮箱) 14周周三凌晨0点:小作业截止时间
小作业题目 作业简介:从以下题目中自选一题,根据相关资料与自己的理解,形成篇幅在10页左右的综述论文 题目1:迁移学习的研究及其应用 推荐论文:Taskonomy: Disentangling Task Transfer Learning 题目2:GAN模型的研究及其应用 推荐论文:Beyond Narrative Description: Generating Poetry from Images by Multi-Adversarial Training 题目3:LSTM模型的研究及其应用 推荐论文:Global context-aware attention lstm networks for 3d action recognition 作业要求: 论文的格式需遵循软件学报模板 论文内容详实,章节中至少应包括模型简介、数学推导、相关工作及应用举例、自己对该类模型的见解等章节,无明显抄袭痕迹 可额外添加算法实现及性能分析部分,该部分将加分
大作业题目 作业简介:从最近两年的CVPR,ICCV,ECCV论文中自选一题,根据相关资料与自己的理解,形成一次8分钟左右的主题报告 作业要求: 报告的形式需遵循会议口头宣讲流程; 注意掌握时间,超时将被打断; 宣讲内容详实,有自己对该课题的见解,无明显抄袭痕迹; 宣讲完成后,有提问环节,提问回答质量计入分数 截止时间: 12周周一0点
如何做Presentation 让我们看一个实例PPT
提纲 数学基础 数字图像的概念与描述 数字图像的存储位图文件 图像的数字化 数字图像的灰度直方图
线性代数 From 南京大学吴建鑫老师
线性代数
线性代数
线性代数
概率与统计
概率与统计
概率与统计 累积分布函数CDF;累加效应 Probability density function
概率与统计
概率与统计
概率与统计
概率与统计
概率与统计
概率与统计
概率与统计
提纲 数学基础 数字图像的概念与描述 数字图像的存储位图文件 图像的数字化 数字图像的灰度直方图
数字图像的概念与描述:概念 所谓的数字图像的描述是指如何用一个数值方式来表示一个图像。 数字图像是图像的数字表示,像素是其最小的单位。
数字图像的概念与描述:图像的描述 因为矩阵是二维的,所以可以用矩阵来描述数字图像。 描述数字图像的矩阵目前采用的是整数阵,即每个像素的亮暗,用一个整数来表示。
数字图像的概念与描述:图像的坐标系 矩阵是按照行列的顺序来定位数据的,但是图像是 在平面上定位数据的,所以坐标系的定义具有特殊 性。 为了编程方便起见,这里以矩阵坐标系来定义图像 的坐标。 行(i) 列(j) 矩阵 A(i,j) 矩阵坐标系 X轴(i) Y轴(j) 图像 f(i,j) 直角坐标系
数字图像的概念与描述:黑白图像 黑白图像是指图像的每个像素只能是黑或 者白,没有中间的过渡,故又称为2值图像。 2值图像的像素值为0、1。
黑白图像例
数字图像的概念与描述:灰度图像 灰度图像是指每个像素的信息由一个量化的灰 度级来描述的图像,没有彩色信息。
灰度图像例
数字图像的概念与描述:彩色图像 彩色图像是指每个像素的信息由RGB三原色构 成的图像,其中RGB是由不同的灰度级来描述的。 彩色图像不能用一个矩阵来描述了,一般是用 三个矩阵同时来描述。
彩色图像例
提纲 数学基础 数字图像的概念与描述 数字图像的存储位图文件 图像的数字化 数字图像的灰度直方图
数字图像的存储位图文件:文件的总体结构 数据区 BITMAPFILEHEADER BITMAPINFOHEADER 真彩色模式 索引色模式 文件头 BITMAPFILEHEADER 信息头 BITMAPINFOHEADER 数据区 文件头 BITMAPFILEHEADER 信息头 BITMAPINFOHEADER 调色板 RGBQUAD 数据区 像素的RGB值 像素的调色板索引值
数字图像的存储位图文件:文件头信息 bfType 文件类型标识“BM” bfSize 文件总字节数 bfReserved1 保留字“0” 文件头 BITMAPFILEHEADER bfType 文件类型标识“BM” bfSize 文件总字节数 bfReserved1 保留字“0” bfReserved2 保留字“0”
数字图像的存储位图文件:信息头信息 BITMAPINFOHEADER 信息头 biSize 信息头结构体长度,为40 biWidth 图像宽度,单位是像素 biHeight 图像高度,单位是像素 biPlanes 必须为1,暂无意义 biBitCount 颜色或灰度bit位数 biCompression 指定位图是否压缩 biSizeImage 实际位图数据所占字节数 biXperlsPerMeter 指定目标设备的水平分辨率 biYperlsPerMeter 指定目标设备的垂直分辨率 biClrImportant 图像中重要的颜色数
数字图像的存储位图文件 —— 真彩色模式的数据区结构 数字图像的存储位图文件 —— 真彩色模式的数据区结构 像素的RGB值 真彩色数据区 :
数字图像的存储位图文件 ——索引色模式的调色板 数字图像的存储位图文件 ——索引色模式的调色板 调色板 RGBQUAD 索引值 R G B 1 R1 G1 B1 2 R2 G2 B2 : : N RN GN BN
数字图像的存储位图文件 ——索引色模式的数据区 数字图像的存储位图文件 ——索引色模式的数据区 数据区 像素的调色板索引值 索引值 R G B 1 R1 G1 B1 2 R2 G2 B2 : : N RN GN BN
提纲 数学基础 数字图像的概念与描述 数字图像的存储位图文件 图像的数字化 数字图像的灰度直方图
图像的数字化 所谓的图像数字化,是指将模拟图像经过离散化 之后,得到用数字表示的图像。 图像的数字化包括了空间离散化(即采样)和明 暗表示数据的离散化(即量化)。
图像的数字化:采样概念 采样是指将在空间上连续的图像转换成离散的 采样点(即像素)集的操作。 由于图像是二维分布的信息,所以采样是在 x轴 和y轴两个方向上进行的。一般情况下, x轴方向 与y轴方向的采样间隔相同。
图像的数字化:采样间隔 采样时的注意点是:采样间隔的选取。 采样间隔太小,则增大数据量;太大, 则会发生信息的混叠,导致细节无法辨认。
图像的数字化:采样效果演示示例 细节清晰,数据量为100% 细节无法辨认,数据量为1%
图像的数字化:采样指标分辨率 分辨率是指映射到图像平面上的单个像素 的景物元素的尺寸。 单位:像素/英寸,像素/厘米 (如:扫描仪的指标 300dpi) 分辨率或者是指要精确测量和再现一定尺寸的图像所必需的像素个数。 单位:像素*像素 (如:数码相机指标800万像素(~3600*2400))
图像的数字化:量化概念 量化是将各个像素所含的明暗信息离散化后, 用数字来表示。一般的量化值为整数。 充分考虑到人眼的识别能力之后,目前非特殊 用途的图像均为8bit量化,即采用0 ~ 255的整 数来描述“从黑到白”。 在3bit以下的量化,会出现伪轮廓现象。
低bit量化的伪轮廓现象图例
图像的数字化:量化方法 量化可分为均匀量化和非均匀量化。 均匀量化是简单地在灰度范围内等间隔量 化。 非均匀量化是对像素出现频度少的部分量化 间隔取大,而对频度大的量化间隔取小。 一般情况下,对灰度变化比较平缓的部分用比较多的量化级,在灰度变化比较剧烈的地方用比较高的分辨率。
均匀量化效果示意图
非均匀量化效果示意图
均匀量化与非均匀量化效果的比较
量化与采样的效果图例 原图 低灰度级量化 低分辨率
提纲 数学基础 数字图像的概念与描述 数字图像的存储位图文件 图像的数字化 数字图像的灰度直方图
数字图像的灰度直方图 在数字图像处理中,灰度直方图是最简单且最有用 的工具,可以说,对图像的分析与观察,直到形成 一个有效的处理方法,都离不开直方图。
数字图像的灰度直方图:定义 灰度直方图是灰度级的函数,是对图像中灰度级分 布的统计。有两种表示形式 1)图形表示形式 横坐标表示灰度级,纵坐标表示图像中对应某灰度 级所出现的像素个数。 2) 数组表示形式 数组的下标表示相应的灰度级,数组的元素表示该 灰度级下的像素个数。
数字图像的灰度直方图 —— 计算例子 1 2 3 4 5 6 灰度直方图
灰度图的灰度直方图例
彩色图的灰度直方图例
数字图像的灰度直方图 —— 性质 所有的空间信息全部丢失; 每一灰度级的像素个数可直接得到。
数字图像的灰度直方图 —— 应用 前面提到过,灰度直方图是最简单的,最有用的工具。 数字图像的灰度直方图 —— 应用 前面提到过,灰度直方图是最简单的,最有用的工具。 简单性从其一维的数据形式,以及简单的计算方法可 以感受到有用性,在这里通过几个应用例子来说明。
数字图像的灰度直方图应用 —— 数字化参数 直方图给出了一个简单可见的指示,用来判断 一幅图像是否合理的利用了全部被允许的灰度级范 围。 数字图像的灰度直方图应用 —— 数字化参数 直方图给出了一个简单可见的指示,用来判断 一幅图像是否合理的利用了全部被允许的灰度级范 围。 一幅图像应该利用全部或几乎全部可能的灰度 级,否则等于增加了量化间隔。丢失的信息将不能 恢复。
数字图像的灰度直方图应用 —— 分割阈值选取 数字图像的灰度直方图应用 —— 分割阈值选取 假设某图像的灰度直方图具有二峰性,则表明 这个图像较亮的区域和较暗的区域可以较好地分 离。 取二峰间的谷点为阈值点,可以得到好的二值 处理的效果。
灰度直方图具有二峰性
具有二峰性的灰度图的二值化
灰度分布效果图例
Any Questions?