Deep learning 调研.

Deep learning 调研

机器学习

机器学习手工地选取特征是一件非常费力、启发式的方法

深度学习背景又名：UnsupervisedFeature Learning 启发自：人脑视觉机理，
方向选择性神经元（Orientation Selective Cell）

深度学习背景

DL基本思想有一个系统S，它有n层（S1,…Sn），它的输入是I，输出是O
I =>S1=>S2=>…..=>Sn => O 如果输出O等于输入I，即输入I经过这个系统变化之后没有任何的信息损失

DL&Neural Network

DL&Neural Network 神经网络存在问题： 1）比较容易过拟合，参数比较难tune，而且需要不少trick；
2）训练速度比较慢，在层次比较少（小于等于3）的情况下效果并不比其它方法更优 BP算法存在的问题：（1）梯度越来越稀疏：从顶层越往下，误差校正信号越来越小；（2）收敛到局部最小值：尤其是从远离最优区域开始的时候（随机值初始化会导致这种情况的发生）；（3）一般，我们只能用有标签的数据来训练：但大部分的数据是没标签的，而大脑可以从没有标签的的数据中学习；

DL训练过程 1）使用自下上升非监督学习（就是从底层开始，一层一层的往顶层训练）：
采用无标定数据（有标定数据也可）分层训练各层参数，这一步可以看作是一个无监督训练过程，是和传统神经网络区别最大的部分（这个过程可以看作是feature learning过程）：具体的，先用无标定数据训练第一层，训练时先学习第一层的参数（这一层可以看作是得到一个使得输出和输入差别最小的三层神经网络的隐层），由于模型capacity的限制以及稀疏性约束，使得得到的模型能够学习到数据本身的结构，从而得到比输入更具有表示能力的特征；在学习得到第n-1层后，将n-1层的输出作为第n层的输入，训练第n层，由此分别得到各层的参数；

DL训练过程 2）自顶向下的监督学习（就是通过带标签的数据去训练，误差自顶向下传输，对网络进行微调）：
基于第一步得到的各层参数进一步fine-tune整个多层模型的参数.第一步类似神经网络的随机初始化初值过程，由于DL的第一步不是随机初始化，而是通过学习输入数据的结构得到的，因而这个初值更接近全局最优，从而能够取得更好的效果；所以deep learning效果好很大程度上归功于第一步的feature learning过程。

DL常用模型或方法 AutoEncoder自动编码器

AutoEncoder

Sparse AutoEncoder

Denoising AutoEncoders
降噪自动编码器DA是在自动编码器的基础上，训练数据加入噪声，所以自动编码器必须学习去去除这种噪声而获得真正的没有被噪声污染过的输入。因此，这就迫使编码器去学习输入信号的更加鲁棒的表达，这也是它的泛化能力比一般编码器强的原因。DA可以通过梯度下降算法去训练。

Sparse Coding稀疏编码一个信号表示为一组基的线性组合，要求只需要较少的几个基就可以将信号表示出来。
O = a1*Φ1 + a2*Φ2+….+ an*Φn， Φi是基，ai是系数，我们可以得到这样一个优化问题： Min |I – O| + u*(|a1| + |a2| + … + |an |)

Sparse Coding稀疏编码

稀疏编码训练过程 1）Training阶段：给定一系列的样本图片[x1, x 2, …]，我们需要学习得到一组基[Φ1, Φ2, …]，也就是字典。（EM思想） 2）Coding阶段：给定一个新的图片x，由上面得到的字典，得到稀疏向量a。这个稀疏向量就是这个输入向量x的一个稀疏表达了。

稀疏编码用途降维提取特征寻找基

RBM限制波尔兹曼机判别模型学习条件概率p（y|x）生成模型学习联合概率p(x,y) p(y|x)=p(x,y)/p(x)

RBM限制波尔兹曼机能力模型（Energy Based Model)
假设所有的节点都是随机二值变量节点，同时假设全概率分布p(v,h)满足Boltzmann 分布，我们称这个模型是Restricted BoltzmannMachine (RBM)。

RBM用途 1对数据编码，然后交给上层学习方法 2得到权重矩阵和偏移量，供BP初始化

DBN深信度网络

DBN应用灵活容易拓展

CNN卷积神经网络

CNN卷积神经网络每个滤波器5*5=25个unit参数和一个bias参数，一共6个滤波器，共(5*5+1)*6=156个参数,共156*(28*28)=122,304个连接。

CNN卷积神经网络主要用来识别位移、缩放及其他形式扭曲不变性的二维图形并行学习语音识别
每个滤波器5*5=25个unit参数和一个bias参数，一共6个滤波器，共(5*5+1)*6=156个参数,共156*(28*28)=122,304个连接。

I am a Smartwatch and I can Track my User’s Arm (mobisys2016)

MoLe: Motion Leaks through Smartwatch Sensors (mobicom)2015

Lasagna:Towards Deep Hierarchical Understanding and Searching over Mobile sensing Data(mobisys 2016)

THank U

Deep learning 调研.

Similar presentations

Presentation on theme: "Deep learning 调研."— Presentation transcript:

Similar presentations

About project

反馈

请登录

Auth with social network:

Deep learning 调研.

Similar presentations

Presentation on theme: "Deep learning 调研."— Presentation transcript:

Similar presentations

About project

反馈