CNN&Alexnet模型简单总结

发表于 2018-10-30 分类于三分技术浏览：阅读时长 ≈ 3 分钟

Alexnet是CNN的领航之作,也是我学习的第一个框架,本文为学习过程中的笔记,大部分来自网络

前期准备

什么是全连接层
- 我们把所有神经元都会和下一层的所有神经元相连的这种连接，叫做 全连接(Fully-connected layer)
- 全连接一般会把卷积输出的二维特征图转化成一维的一个向量,把一张图高度浓缩成一个数了
- 全连接的目的是什么呢？因为传统的网络我们的输出都是分类，也就是几个类别的概率甚至就是一个数–类别号，那么全连接层就是高度提纯的特征了，方便交给最后的分类器或者回归
- 解释一下全连接层
一些英文
1. Stride->步长
2. Filter->卷积核
3. Padding->填充
4. Kernel size->卷积核的大小
5. Normalization layer->归一层
6. Convolutional layer->卷积层
7. Fully-Connected layer->全连接层
一些解释
1. 为什么要用卷积运算
  
  卷积运算的目的是提取输入的不同特征，第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级，更多层的网络能从低级特征中迭代提取更复杂的特征。
2. 为什么要用激活函数
3. 为什么要有池化层
  
  通常在卷积层之后会得到维度很大的特征，将特征切成几个区域，取其最大值或平均值，得到新的、维度较小的特征。
4. 为什么要用全连接层
  
  把所有局部特征结合变成全局特征，用来计算最后每一类的得分。
5. 数据预处理
  1. 资料1
6. 训练速率
  
  如果设置的学习速率太小，你的模型可能需要几年才能收敛;如果学习速率太大，在开始训练几个样本之后，你的损失值(loss)可能会迅速增加。一般来说，0.01 的学习速率是安全的
搭建一个神经网络一般的步骤
典型神经网络训练过程
- 定义一个有着可学习的参数（或者权重）的神经网络
- 对着一个输入的数据集进行迭代:for step, (inputs,labels) in enumerate(train_loader)
- 用神经网络对输入进行处理 output = cnn(inputs)
- 计算Loss (对输出值的修正到底有多少)loss_func = nn.CrossEntropyLoss()
- 梯度归零optimizer.zero_grad()
- 将梯度传播回神经网络的参数中 loss.backward()
- 更新网络中的权重 optimizer.step()通常使用简单的更新规则(SGD): weight = weight + learning_rate * gradient
如何计算卷积后图片大小(尺寸)
2. 图片的尺寸= (原来的尺寸-卷积核的尺寸+填充*2)/步长+1
3. 深度 = 卷积核的数量
计算池化后图片的大小(尺寸)
2. 图片的尺寸 = （原来的尺寸-卷积核的尺寸）/步长+1
3. 深度不变
4. 为什么要把特征图摊平？

Alexnet

图解
各种图片尺寸的解读
1. CONV155 = (227-11+2*0)/4+1 = 55
2. MAXPOOL1 27 = (55-3)/2+1 = 27
3. CONV2 27 = (27-5+2*2)/1 +1= 27
4. MAXPOOL2 13 = (27-3)/2+1 = 13
5. MAXPOOL3 6 = (13-3)/2 +1 = 6
Alexnet为啥取得比较好的效果
1. 使用了Relu激活函数
2. Dropout
  
  Dropout也是经常说的一个概念，能够比较有效地防止神经网络的过拟合。相对于一般如线性模型使用正则的方法来防止模型过拟合，而在神经网络中Dropout通过修改神经网络本身结构来实现。对于某一层神经元，通过定义的概率来随机删除一些神经元，同时保持输入层与输出层神经元的个人不变，然后按照神经网络的学习方法进行参数更新，下一次迭代中，重新随机删除一些神经元，直至训练结束。

Pytorch

为什么要用torch.nn.Sequential
1. torch.nn.Sequential是一个Sequential容器，模块将按照构造函数中传递的顺序添加到模块中
2. 点击这里查看更多

一些函数的参数介绍

Conv2d


 nn.Conv2d(                 	# input shape (1, 28, 28)	
           in_channels=1,              # input height
           out_channels=16,            # n_filters
           kernel_size=5,              # filter size
           stride=1,                   # filter movement/step
           padding=2 ) # if want same width and length of this image after con2d. 

# Padding=(kernel_size-1)/2 if stride=1
# output shape (16, 28, 28)

torch.max()

待解决问题

如何使用已经保存了的神经网络
res = conv5_out.view(conv5_out.size(0), -1) out = self.dense(res) 这两行代码的意思
为什么要用激活函数？

C1oser

CNN&Alexnet模型简单总结

前期准备

Alexnet

Pytorch

待解决问题

参考资料