-
『深度思考』为什么卷积神经网络具有平移不变性
2019-08-15 09:47:47卷积:简单地说,图像经过平移,相应的特征图上的表达也是平移的。 下图只是一个为了说明这个问题的例子。输入图像的左下角有一个人脸,经过卷积,人脸的特征(眼睛,鼻子)也位于特征图的左下角。 假如人脸...为什么卷积神经网络具有平移不变性
简单地说,卷积+最大池化约等于平移不变性。
卷积:简单地说,图像经过平移,相应的特征图上的表达也是平移的。
下图只是一个为了说明这个问题的例子。输入图像的左下角有一个人脸,经过卷积,人脸的特征(眼睛,鼻子)也位于特征图的左下角。
假如人脸特征在图像的左上角,那么卷积后对应的特征也在特征图的左上角。
在神经网络中,卷积被定义为不同位置的特征检测器,也就意味着,无论目标出现在图像中的哪个位置,它都会检测到同样的这些特征,输出同样的响应。比如人脸被移动到了图像左下角,卷积核直到移动到左下角的位置才会检测到它的特征。
池化:比如最大池化,它返回感受野中的最大值,如果最大值被移动了,但是仍然在这个感受野中,那么池化层也仍然会输出相同的最大值。这就有点平移不变的意思了。
所以这两种操作共同提供了一些平移不变性,即使图像被平移,卷积保证仍然能检测到它的特征,池化则尽可能地保持一致的表达。
总结
卷积的平移不变性就是通过卷积+池化以后不管某一特征移动了位置,总可以检测出来输入到下一层中,又由于全连接是加权求和计算,被CNN激活的特征又可以传导到下一层中。
参考
1.https://www.cnblogs.com/Terrypython/p/11147490.html
-
卷积中反转平移的理解
2019-08-03 23:02:14在卷积的定义中为什么函数g(τ)要先翻转为g(-τ)再平移为g(x-τ)而不是直接记作g(τ-x)这样做有什么好处么? 说点我的理解,希望有所帮助。(楼上也有类似观点,不过按照我的理解再解释一下) 教程中卷积运算的...在卷积的定义中为什么函数g(τ)要先翻转为g(-τ)再平移为g(x-τ)而不是直接记作g(τ-x)这样做有什么好处么?
说点我的理解,希望有所帮助。(楼上也有类似观点,不过按照我的理解再解释一下)
教程中卷积运算的解释是反褶g(-τ)、移位g(x-τ)、加权f(τ) *g(x-τ)、叠加(积分)。这一解释是符合实际系统响应的过程的。
关键就是时间线,输入信号和系统响应是在同一个时空,同一时间线上发生的。
我们记录信号如上图中第一行f(t)是输入信号,g(t)是系统响应,两者都是在同一个坐标系中按照时间流逝方向描述的,这个描述没有问题。但是如果两个信号在同一时空相互作用时,就不能直接移位积分(这样操作是求互相关)。实际中输入信号是从0时刻开始进入系统,而系统的响应也是从0时刻开始产生作用的。看第三行,系统响应经过反褶再平移,即输入信号的零时刻进入系统的零时刻,随着时间推移,两者逐步交叠,仔细想想,这样才是和实际情况是一致的。反褶再移位、加权、叠加(积分)只是模拟了现实中一个信号进入一个系统并输出结果的实际过程。
另外
对于卷积还有另外一种解释,将卷积理解为对系统响应移位g(t-τ)、加权(权值为某时刻输入信号f(τ))再叠加的过程。(参见https://www.zhihu.com/question/22298352… 不推荐用“反转/翻转/反褶/对称”等解释卷积。好好的信号为什么要翻转?导致学生难以理解卷积的物理意义。)
这种解释看似相对反褶、移位、加权、叠加的方式更好理解一些,但它只是卷积一个数学计算方法,没有以时间和发生过程为标尺,和实际过程是不相符的。反褶后移位、加权、叠加输出的结果就是输入信号进入系统后按照时间推移得到的系统响应y(t)。参见https://en.wikipedia.org/wiki/Convolution…中的两幅动画很生动。
而移位、加权、叠加的方式只存在于数学计算中,即卷积可以一次算出一个信号在所有时间的响应值,再把各个信号相加,这在实际中是不可能发生的。最后再上一张wiki中的图片,直观的比较出了卷积、互相关和自相关计算的差别
-
图像的平移映射变换
2019-03-20 00:07:02究竟是什么意思呢?其实就是将图像或者图像的一部分放置在另一幅图像中,使得它们能够和指定的区域或者标记物对齐 原理 其中又涉及到单应性变换,那么何为单应性呢? 单应性在不同学科上有各种不同的含义。 在数学上...前言
今天要做的是一个图像中的图像
究竟是什么意思呢?其实就是将图像或者图像的一部分放置在另一幅图像中,使得它们能够和指定的区域或者标记物对齐原理
其中又涉及到单应性变换,那么何为单应性呢?
单应性在不同学科上有各种不同的含义。
在数学上:它有更通用的意思。
在计算机视觉中:对单应性最感兴趣的部分只是其他意义的一个子集。平面的单应性被定义为从一个平面到另一个平面的投影映射。比如,一个二维平面上的点映射到摄像机成像仪上的映射就是平面单应性的例子。
这次我们实验的主要内容就是把一张图片放到另一张图片上去,或者说是映射上去。alpha通道
alpha通道其实就是表示一个图像的透明度,值为0~1。0表示完全透明,1表示完全不透明。代码实现
这当中的warp是要自己写出来这个报然后在进行调用
运行结果
点击鼠标右键点击Run运行程序
运行结果如上图,其实我们还可以自己调整照片的映射位置
可用自己将楼房的空白地方投射相应的照片,达到不同的奇幻效果! -
有关edem仿真中,旋转与平移的相关问题。
2018-12-21 20:35:55有关edem仿真中,旋转与平移的相关问题。 首先建立3维模型,是一个辊子在往复平移过程中加上自身的旋转 两种运动的先后顺序会影响最终的结果 首先要知道“平移”和“旋转”那个优先级高,也就是说让辊子先“平移...有关edem仿真中,旋转与平移的相关问题。
首先建立3维模型,是一个辊子在往复平移过程中加上自身的旋转
两种运动的先后顺序会影响最终的结果首先要知道“平移”和“旋转”那个优先级高,也就是说让辊子先“平移”还是先“旋转”?
在edem中认为“平移”是实体在“平移”,这个没什么好说的;
“旋转”按照一个特定的旋转轴“旋转”,这个转轴有两种定义方式1、固定转轴,2、跟随实体移动的转轴。固定转轴就是固定的,也没什么好说的,这里主要强调“跟随实体移动的转轴”,既然它跟随实体移动,那么在这个旋转命令之前必然要有一个使辊子平移的指令,然后根据这个指令才可以实现“跟随实体移动的转轴”的运动。所以在2、跟随实体移动的转轴的方式下必须先有平移,在有旋转,也就是说将旋转指令放在所有同一时间平移指令之后。
这样的话才可以实现辊子在往复运动下加入自身的旋转的运动。 -
平移指数基变换
2020-09-14 21:43:20最近思考了一下,这个问题其实至少有 Θ((nlogn)...定义平移指数基是这样一组基:xkerkxx^k \mathrm e^{r_k x}xkerkx,也就是说平移指数基变换是给一个数组 aka_kak 和 rkr_krk,求 ∑kakxkerkx \sum_k a_k x -
平移不变性Translation Invariance、旋转/视角不变性Ratation/Viewpoint Invariance、尺度不变性Size、...
2020-02-03 12:43:58文章目录不变性定义不变性分类为什么卷积神经网络具有平移不变性 不变性定义 意味着即使目标的外观发生了某种变化,但是你依然可以把它识别出来。这对图像分类来说是一种很好的特性,因为我们希望图像中目标无论是... -
用JS写的贪吃蛇,为什么定时器结束后会自动平移一格?
2019-04-01 15:14:55//食物就是一个对象,有宽,有高,有颜色,有横纵坐标,先定义构造函数,然后创建对象 function Food(width,height,color,x,y){ this.width=width||20; this.height=height||20; this.color=color||"green"; ... -
css 平移到某个位置_css怎么移图片位置?
2021-02-01 01:03:57css怎么移图片位置?下面本篇文章就来给大家介绍一下使用CSS移动图片位置的...任何元素都可以定位,不过绝对或固定元素会生成一个块级框,而不论该元素本身是什么类型。相对定位元素会相对于它在正常流中的默认位置... -
在opencv的图像拼接stitch_detail.cpp中怎么计算子图像的xyz平移量?
2016-11-25 06:14:19怎么获得图像xyz轴的平移量?(z轴应该是指图像的缩放) 调整图像(透视变换)的代码片段如下: ``` is_compose_scale_set = false; // false Mat img_warped, img_warped_s; Mat dilated_mask, seam_... -
自相关函数怎么理解,为什么定义中有共轭,卷积呢。定义中的卷积,共轭有什么意义?尤其是在信号处理方面
2018-11-09 14:26:49自相关的直观含义就是:把一个信号平移一段距离,跟原来有多相似。 于是就有了自相关的定义: 它代表了“移、乘、积”这三步操作。 如果只谈自相关,其实到此就可以结束了。 只不过,在信号处理领域中还有... -
自相关函数怎么理解,为什么定义中有共轭,卷积呢...定义中的卷积,共轭有什么意义?尤其是在信号处理方面...
2016-06-16 05:26:00自相关的直观含义就是:把一个信号平移一段距离,跟原来有多相似。 于是就有了自相关的定义: 它代表了“移、乘、积”这三步操作。 如果只谈自相关,其实到此就可以结束了。 只不过,在信号处理领域中还有一... -
在定义卷积时为什么要对其中一个函数进行翻转
2018-04-20 22:39:00在卷积的定义中为什么函数g(τ)要先翻转为g(-τ)再平移为g(x-τ)而不是直接记作g(τ-x)这样做有什么好处么? 我知道问一个概念的定义就好像问"妈妈"为什么要叫"妈妈"一样。但我始终觉得这样的定义有些别扭。想知道... -
【线性代数的本质|笔记】向量究竟是什么
2020-07-17 22:20:13因为长度+方向唯一地确定一个向量,因此物理学的观点中描述的向量是自由向量,可以自由平移一个向量且保持该向量不变。 CS观点 向量是有序的数字列表 在实际问题中我们往往会使用一串数字对问题进行描述和建模,... -
什么是卷积
2019-05-09 12:20:39它是通过两个函数f和g生成第三个函数的一种数学运算,表征函数f与g经过翻转和平移的重叠部分的面积。 卷积的计算公式如下: f(t)先不动, g(-t)相当于g(t)函数的图像沿y轴(t=0)做了一次翻转。g(x-t)相当于g(-... -
概率论g是什么分布_整数上的均匀分布
2020-11-21 14:01:48事实上这意味着一个定义在整数上的,平移不变的概率分布,即 , , , , .并且作为概率分布,要求可列可加性,即最多可列个互斥集合的并的概率等于各自概率之和。这个概率分布显然不存在,因为假如一个整点的概率为p,... -
图象关于y轴对称是什么意思_高中数学常考问题1:函数、基本初等函数的图象与性质,真题分析...
2021-01-09 18:52:15真题感悟·考题分析...二是图象变换法,其中图象变换有平移变换、伸缩变换和对称变换。2.函数的性质(1)单调性:单调性是函数在其定义域上的局部性质.证明函数的单调性时,规范步骤为取值、作差、变形、判断符... -
Java vs C# —— J2EE与.NET平台关于电子企业的两种设想(4)
2006-10-11 23:37:00J2EE体系结构与.NET平台相比,Sun公司的标准定义的J2EE体系结构有很少可以讨论的空间,因为就没有什么可讨论的。如果一个人注意某个具体开发商的产品,如IBM公司的WebSphere,那么就会看到其技术的最大的一部分是... -
J2ee与ASP.NET平台电子企业的两种构想(4)
2001-08-16 16:37:00J2EE体系结构与.NET平台相比,Sun公司的标准定义的J2EE体系结构有很少可以讨论的空间,因为就没有什么可讨论的。如果一个人注意某个具体开发商的产品,如IBM公司的WebSphere,那么就会看到其技术的最大的一部分是... -
简单剪刀石头布的识别:问题记录
2020-12-23 22:50:25几何矩是由Hu(Visual pattern recognition by moment invariants)在1962年提出的,具有平移、旋转和尺度不变性。 定义如下: ① (p+q)阶不变矩定义: ② 对于数字图像,离散化,定义为: ③ 归一化中心矩定义: ... -
涉及SLAM的基本概念通俗解释
2018-11-28 22:11:40李群的定义是指连续光滑的群 什么是SO(3)什么是SE(3)? SO(3)是旋转矩阵群,SE(3)是变换矩阵群,其中变换矩阵是旋转加上平移。 什么是李代数? 为啥需要李代数? 首先:观测数据z = (位姿)T * (空间点p) + noise... -
想问一下大佬们,为什么这段程序的液晶屏上无法显示湿度的检测值?
2020-10-29 23:27:06//定义串口接收数据变量 uint count=0; /////////////定时器计数 uchar wendu1,wendu2,yanwu1,yanwu2,yanwu3; ///串口发送温度,光照值暂存 unsigned char ADbuf;//设置8位的寄存器用来暂存A/D转换结果 ////////... -
C#5.0本质论第四版(因文件较大传的是百度网盘地址)
2015-10-16 10:14:5114.3 是什么使类成为集合:IEnumerable 392 14.3.1 foreach和数组 392 14.3.2 foreach和IEnumerable 393 14.3.3 foreach循环内不要修改集合 396 14.4 标准查询操作符 397 14.4.1 使用Where()来... -
设置机器人的tf变换
2019-07-04 17:42:14抽象的来讲,一棵tf变换树定义了不同坐标系之间的平移与旋转变换关系。具体来说,我们假设有一个机器人,包括一个机器人移动平台和一个安装在平台之上的激光雷达,以这个机器人为例,定义两个坐标系,一个坐标系以... -
6.傅里叶变换
2019-08-23 07:02:08傅里叶变换的定义是什么? 时域和频率域怎么理解?什么是频域图像? 什么是相位谱? 为什么傅里叶变换可以用于图像滤波? 二 二维傅里叶变换 频谱图示例 旋转平移对频谱图的影响 旋转平移对相角图的影响 ... -
【基于VP的消失点标注】线性代数与仿射变换
2020-05-16 18:35:28平移变换比较好理解,那么什么是线性变换呢?下面给出线性变换的几个特征: 变换之前是直线的,变换之后依然是直线。 变换前后比例不会变。也就是说,一开始某个点是线段的中点,在变换之后,依然还是重点。 旋转... -
dsp广告和信息流广告区别_360信息流广告如何投放?360信息流广告有什么优势
2020-11-07 23:53:37360公司持续加码信息流广告,凭借海量跨端的资源、全球领先的个性化重定向技术、功能化的精细投放模式三大优势,重新“定义”信息流广告,为广告主构筑起一个“全场景、智能化”的营销平台。超50亿优质流量 全场景... -
通俗易懂的理解卷积
2020-02-26 11:16:34然后再把g函数平移到n,在这个位置对两个函数的对应点相乘,然后相加,这个过程是卷积的“积”的过程。 这篇文章主要想解释两个问题: 卷积这个名词是怎么解释?“卷”是什么意思?“积”又是什么意思? 卷积背后的...
-
my-first-laravel-package:学习时构建的Laravel包-源码
-
朱老师鸿蒙系列课程第1期-2鸿蒙系统Harmonyos源码架构分析
-
具有非对称T形DGS谐振器的双带阻滤波器
-
华为1+X——网络系统建设与运维(中级)
-
MedianFilter.cu
-
疾病预防控制中心-源码
-
股份:事件发生的地方广场-源码
-
MySQL NDB Cluster 负载均衡和高可用集群
-
CycloneIV_EP4CE15开发板SDRAM VGA MicroSD卡 千兆以太网 UART读写等9个DEMO QUARTUS逻辑工程文件.zip
-
零基础极简以太坊智能合约开发环境搭建并开发部署
-
MySQL 存储过程(创建海量数据实验环境)
-
Murach’s ADO.NET 4 Database Programming with C# 2010
-
Archimedes_spiral.zip
-
Android中为控件设置边框
-
Visual C++ OPC Client Example.rar
-
CB测试-源码
-
云开发后台+微信扫码点餐小程序+cms网页管理后台 含后厨端和用户端
-
DP算法题收集汇总
-
面罩检测器:使用卷积神经网络(CNN)的面罩检测器-源码
-
MMM 集群部署实现 MySQL 高可用和读写分离