Tensorflow入门--------计算卷积后的特征图尺寸_三维卷积后的尺寸怎么计算-程序员宅基地

技术标签: tensorflo  机器学  tensorflow学习  

     在卷积神经网络设计网型的时候,需要对卷积核和池化层进行参数设置。有三个重要的参数,首先是卷积核的大小,其次是设置步长(padding)的大小,最后是是否采用padding。这几个因素直接影响了卷积、池化后的特征图的大小,对于网络形状的设计非常重要的参数。本博客将针对这三个参数进行解释,并且利用tensorflow进行结论的实验。

一、卷积核

    卷积核这个东西比较好理解,就是卷积滤波器的大小,当然,卷积核也可能是三维的。卷积的过程如如图2所示,其中的卷积核是3*3的卷积。三维卷积的形状如图1。

                                                                                    图1 三维卷积 

二、步长(stride)

所谓的步长就是卷积核在原始图像上每一次移动的步数,如图2所示该卷积操作的步长为1,步长用stride来表示。

                                                                                图2 卷积操作的过程 

三、填充(padding)

当我们用一个卷积核去和一个影像进行卷积操作的时候,我们可以发现,不同位置的像素利用率是不同的,例如位于图像中心的像素,它参与了多次的卷积运算,对整个卷积过程的贡献大。但是想图像四个角的像素只参与了以此的卷积运算,贡献就被忽略了。另外,由于卷积操作,使得原始图像的大小不断地减小。为了避免上述的两个问题,我们采用填充的方式,就是在原始图像的四周再添加一圈像素值,这样就能够保证每一个原始图像的像素都参与相同贡献的卷积操作。

从图中可以看出,蓝色的原始影像进行了一个像素的padding操作,这样就使得位于角点的像素也能参与更多的卷积过程。

四、卷积后特征图大小的计算。参考博客卷积后图像大小计算

1.卷积后尺寸计算
out_height=(in_height+2pad-filter_height)/strides[1]+1
out_width=(in_width+2pad-filter_width)/strides[2] +1
2.tensorflow中卷积参数same和valid运算之后的维度计算
(1)same
out_height=ceil(float(in_height))/float(strides[1])
out_width=ceil(float(in_width))/float(strides[2])
(2)valid
out_height=ceil(float(in_height-filter_height+1))/float(strides[1])
out_width=ceil(float(in_width-filter_width+1))/float(strides[2])
(3)参数
padding: SAME和VALID两种形式
filter: [5,5,1,32]表示5*5的卷积核,1个channel,32个卷积核。
strides: [1,4,4,1]表示横向和竖向的步长都为4

五、实验

利用tensorflow进行实际的实验操作。实验的源代码如下:

# -*- coding: utf-8 -*-
import tensorflow as tf
import numpy as np 
"""
Created on Tue Jul 17 10:03:21 2018

@author: C.H.
"""
tf.reset_default_graph()#这一句话非常重要,如果没有这句话,就会出现重复定义变量的错误
x = tf.placeholder(tf.float32, shape=(1, 500, 500, 3))
#分别设置3*3,5*5,7*7三种大小的卷积核
weights1 = tf.get_variable('weights1',shape=[3, 3, 3, 16],dtype=tf.float32,initializer=tf.truncated_normal_initializer(stddev=0.1, dtype=tf.float32))
weights2 = tf.get_variable('weights2',shape=[5, 5, 3, 16],dtype=tf.float32,initializer=tf.truncated_normal_initializer(stddev=0.1, dtype=tf.float32))
weights3 = tf.get_variable('weights3',shape=[7, 7, 3, 16],dtype=tf.float32,initializer=tf.truncated_normal_initializer(stddev=0.1, dtype=tf.float32))
#第一组实验采用步长为1,填充采用SAME,然后采用三种不同大小的卷积核来进行实验,讨论卷积核对卷积后图像大小的影响。第一组实验为其他实验的对照组
conv1 = tf.nn.conv2d(x, weights1, strides=[1, 1, 1, 1], padding='SAME')
conv2 = tf.nn.conv2d(x, weights2, strides=[1, 1, 1, 1], padding='SAME')
conv3 = tf.nn.conv2d(x, weights3, strides=[1, 1, 1, 1], padding='SAME')
#第二组实验,控制卷积核的大小为3*3,分别采用1,2,3三种步长,padding方式采用SAME,讨论步长对卷积后图像大小的影响。
conv4 = tf.nn.conv2d(x, weights1, strides=[1, 1, 1, 1], padding='SAME')
conv5 = tf.nn.conv2d(x, weights1, strides=[1, 2, 2, 1], padding='SAME')
conv6 = tf.nn.conv2d(x, weights1, strides=[1, 3, 3, 1], padding='SAME')
#第三组实验,与第一组实验对照,选择和第一组实验相同的卷积核大小和步长,采用padding的填充方式进行测试。讨论不同padding方式对卷积后图像的影响
conv7 = tf.nn.conv2d(x, weights1, strides=[1, 1, 1, 1], padding='VALID')
conv8 = tf.nn.conv2d(x, weights2, strides=[1, 1, 1, 1], padding='VALID')
conv9 = tf.nn.conv2d(x, weights3, strides=[1, 1, 1, 1], padding='VALID')
#池化过程的'VALID','SAME'参数的对照。讨论不同参数设置对最大池化过程后图像大小的影响
pool1 = tf.nn.max_pool(x, [1, 3, 3, 1], [1, 3, 3, 1], padding = 'VALID')
pool2 = tf.nn.max_pool(x, [1, 3, 3, 1], [1, 3, 3, 1], padding = 'SAME')

with tf.Session() as sess: 
    a =  np.full((1, 500, 500, 3), 2)
    sess.run(tf.global_variables_initializer())
    conv1= sess.run(conv1,feed_dict={x: a})
    conv2= sess.run(conv2,feed_dict={x: a})
    conv3= sess.run(conv3,feed_dict={x: a})
    conv4= sess.run(conv4,feed_dict={x: a})
    conv5= sess.run(conv5,feed_dict={x: a})
    conv6= sess.run(conv6,feed_dict={x: a})
    conv7= sess.run(conv7,feed_dict={x: a})
    conv8= sess.run(conv8,feed_dict={x: a})
    conv9= sess.run(conv9,feed_dict={x: a})
    pool1= sess.run(pool1,feed_dict={x: a})
    pool2= sess.run(pool2,feed_dict={x: a})
    print(conv1.shape)
    print(conv2.shape)  
    print(conv3.shape)  
    print(conv4.shape)  
    print(conv5.shape)  
    print(conv6.shape)  
    print(conv7.shape)  
    print(conv8.shape)  
    print(conv9.shape)  
    print(pool1.shape)  
    print(pool2.shape)  

实验的结果如下:

runfile('E:/Study/研究生文档/深度学习资料/深度学习程序/computeshapeafterconv.py', wdir='E:/Study/研究生文档/深度学习资料/深度学习程序')
(1, 500, 500, 16)#out=ceil(float(in))/float(strides) 
(1, 500, 500, 16)#out=ceil(float(in))/float(strides) 
(1, 500, 500, 16)#out=ceil(float(in))/float(strides) 
(1, 500, 500, 16)#out=ceil(float(in))/float(strides) 
(1, 250, 250, 16)#out=ceil(float(in))/float(strides) 
(1, 167, 167, 16)#out=ceil(float(in))/float(strides) 
(1, 498, 498, 16)#out=ceil(float(in-filter+1))/float(strides) 
(1, 496, 496, 16)#out=ceil(float(in-filter+1))/float(strides) 
(1, 494, 494, 16)#out=ceil(float(in-filter+1))/float(strides) 
(1, 166, 166, 3)#out=floor(float(in))/float(strides)
(1, 167, 167, 3)#out=ceil(float(in))/float(strides)

 另外,在程序中出现了两个需要注意的语句。

tf.reset_default_graph()#这一句话非常重要,如果没有这句话,就会出现重复定义变量的错误

这句话如果没有加在程序的最开始,那么如果你想进行多次程序的运行和调试的时候,程序就会报错。

ValueError: Variable weights1 already exists, disallowed. Did you mean to set reuse=True or reuse=tf.AUTO_REUSE in VarScope? Originally defined at:

  File "D:\Anaconda3-5.0.1-Windows-x86_64\RESULT\envs\tensorflow\lib\site-packages\tensorflow\python\framework\ops.py", line 1625, in __init__
    self._traceback = self._graph._extract_stack()  # pylint: disable=protected-access
  File "D:\Anaconda3-5.0.1-Windows-x86_64\RESULT\envs\tensorflow\lib\site-packages\tensorflow\python\framework\ops.py", line 3160, in create_op
    op_def=op_def)
  File "D:\Anaconda3-5.0.1-Windows-x86_64\RESULT\envs\tensorflow\lib\site-packages\tensorflow\python\framework\op_def_library.py", line 787, in _apply_op_helper
    op_def=op_def)

错误的原因是第一次运行程序的时候,计算图中已经存在所有定义的变量,如果再运行程序,就会重复定义变量。加上重置计算图那个语句就搞定了。

第二个需要注意的地方

conv1= sess.run(conv1,feed_dict={x: a})

在这里将numpy变量a,feed给变量x的时候,每次只能feed一个变量。不能出现下面的写法。

conv1,conv2= sess.run(conv1,conv2,feed_dict={x: a})

 如果这样的话就会出现以下错误:

TypeError: run() got multiple values for argument 'feed_dict'

   总结,这篇博客讨论了卷积运算操作时候的三个重要的参数,卷积核大小,步长大小和填充大小。分别进行了对照试验,验证了总结的经验公式。这种基础操作为网络设计和控制输出tensor大小做了必要的准备。

 

 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_32466233/article/details/81075288

智能推荐

能用 uuid 做 MySQL 的主键吗?-程序员宅基地

文章浏览阅读555次。在mysql中设计表的时候,mysql官方推荐不要使用uuid或者不连续不重复的雪花id(long形且唯一,单机递增),而是推荐连续自增的主键id,官方的推荐是auto_increment..._uuid可以做主键吗

网络命令以及如何使用Ipconfig.exe工具查看TCP/IP配置_ipconfig命令可以用来显示当前tcp/ip配置信息。-程序员宅基地

文章浏览阅读7.2k次,点赞2次,收藏5次。一、Ping命令ping是个使用频率极高的实用程序,主要用于确定网络的连通性。这对确定网络是否正确连接,以及网络连接的状况十分有用。简单的说,ping就是一个测试程序,如果ping运行正确,大体上就可以排除网络访问层、网卡、Modem的输入输出线路、电缆和路由器等存在的故障,从而缩小问题的范围。ping能够以毫秒为单位显示发送请求到返回应答之间的时间量。如果应答时间短,表示数据报不必通过太多的路由器或网络,连接速度比较快。(1) 命令格式ping 主机名; ping 域名; ping IP地址。这_ipconfig命令可以用来显示当前tcp/ip配置信息。

VxWorks6.9 VMware环境使用教程_workbench3.3 + vxworks6.9-程序员宅基地

文章浏览阅读6.3k次,点赞5次,收藏45次。VxWorks6.9的虚拟机环境下的安装与使用!需要资源的请加我钉钉好友,文件太大无法上传资源!!!_workbench3.3 + vxworks6.9

eclipse3 2 汉化 汉化包下载_eclipse3.2下载-程序员宅基地

文章浏览阅读376次。eclipse3 2 汉化 汉化包下载_eclipse3.2下载

JTA1145 休眠唤醒调试总结_tja1145-程序员宅基地

文章浏览阅读2w次,点赞24次,收藏168次。最近因为项目,选择了这颗芯片,花了2天多时间,总算是把这个芯片的休眠唤醒功能基本调了,在这里做一个技术总结,希望可以帮到有需要的人! ****TJA1145芯片简介:**** TJA1145是一款高速CAN收发器,可在控制器局域网(CAN)协议控制器和物理双线式CAN总线之间提供接口。该收发器专门设计用于汽车行业的高速CAN应用 TJA1145在待机模式和睡眠模式下具有超低的功耗,通过使用选择性唤醒功能,高级电源管理调节通过节点的电源,并支持本地(外部IO引脚唤醒,可配置上升沿或者下降沿唤醒)和远程._tja1145

webstorm2018.2.3激活-程序员宅基地

文章浏览阅读930次。一,简介WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为"Web前端开发神器"、"最强大的HTML5编辑器"、"最智能的JavaScript IDE"等。与IntelliJ IDEA同源,继承了IntelliJ IDEA强大的JS部分的功能。二,安装以及激活安装可以直接在官网下载安装,记住自己的安装位置。按照完成后需..._webstorm2018.2激活服务器地址

随便推点

无法迁移解决方案文件““,因为它在磁盘上是只读的..._μvision×无法迁移项目:对象“ text.uvprojx ”是只读的。确定-程序员宅基地

文章浏览阅读863次。无法迁移解决方案文件"",因为它在磁盘上是只读的...在打开.sln文件时,显示由于设置了只读权限而导致无法迁移成功。第一个想到的是把.sln文件的设置中的只读去掉,然而只改这一个会显示项目不可用。我查了资料后,说是右键重新加载项目就好了,然而运行的时候还是会有提示,运行时报错。应该把这一个项目整个都把只读去掉,变成可修改的。找到整个项目的文件夹(一般为.sln文件的上一级目录),然后选中右键,出现属性对话框。点击只读前面的多选框,使之变成如图的空心。应用以后,可能出现如图对话框,如_μvision×无法迁移项目:对象“ text.uvprojx ”是只读的。确定

UEFI开发探索67- YIE001PCIe开发板(03 UEFI驱动)-程序员宅基地

文章浏览阅读716次。(请保留-> 作者: 罗冰 https://blog.csdn.net/luobing4365)上一篇做好了服务型UEFI驱动的示例工程,本篇准备编写测试用的UEFI应用,演示如何使用驱动提供的Protocol。另外,对于如何加载驱动进行测试,也会详细讲述。1编写测试驱动的UEFI应用完成了服务型驱动和相应示例Protocol的构建后,我们准备编写访问示例Protocol的UEFI应用。本节准备的示例工程TestServiceDrv,在文末提供了下载地址。编写测试示例Protoc...

脚本启动和关闭 jupyter notebok 并隐藏命令行_jupyter notebook 不能关cmd-程序员宅基地

文章浏览阅读5k次,点赞12次,收藏15次。脚本启动和关闭 jupyter notebok 并隐藏命令行_jupyter notebook 不能关cmd

链接预测&三元组分类_三元组关系预测-程序员宅基地

文章浏览阅读449次,点赞3次,收藏4次。代码理解,供个人学习_三元组关系预测

Microsoft Excel 已停止工作_microsoft office excel 已停止工作-程序员宅基地

文章浏览阅读2.1k次,点赞2次,收藏3次。问题说明双击Excel文件无法打开,报错“Microsoft Excel 已停止工作”;前期处理方法打开world 、ppt文件正常;尝试重启计算机之后再打开excel文件,无效;前期处理方法_microsoft office excel 已停止工作

C //习题 9.7 在第9章例9.9和例9.10的基础上,写一个函数del,用来删除动态链表中指定的结点。_在第九章例9.9和例9.10的基础上-程序员宅基地

文章浏览阅读5.3k次,点赞8次,收藏9次。习题 9.7 在第9章例9.9和例9.10的基础上,写一个函数del,用来删除动态链表中指定的结点。_在第九章例9.9和例9.10的基础上