如何使用梯度下降法解决CNN问题梯度下降法解决CNN问题的原理过程概述,主要面向对CNN感兴趣的同学,希望能够通过这篇科

首先梯度是一个向量,包含了函数在每个方向上的偏导数,用于表示函数在多个维度上的变化率和方向.

下图为一个曲面在直角坐标系中,各个整数坐标的梯度方向。假设最底端是我们想去的地方,那么需要在各个坐标的位置上不断的向梯度的反方向移动一小段距离△即可,注意每次移动都需要调整方向。这样即可把目标“如何达到最底端”拆解成为一个可执行的数学公式。

其次我们将问题简化成为2维平面直角坐标系,提出一个泛化的问题:如何模拟一个函数,它有有限的输入样本和结果?这个问题目前来看是正向不可解的,就连高中数学的不定方程组还必须增加几个特定的条件:线性连续性,次方的数(一次,二次),问题的空间局限性(明确是直线在有限的角度中切割圆形/椭圆形/三角形/正弦余弦函数等),结果是一个解空间。当问题脱离这些局限性后,就变成无固定数学公式可以套用的问题,而这类问题往往就是现实中最常见预测类问题。可以通过微分逼近的方式,在有限的样本中不断纠正模型的正确性,模拟出来问题的解空间,从而实现预测性。

假设一个问题:红色的点为房屋售价和面积的分布,如何拟合这个解空间?

直线拟合样本分布

曲线拟合样本分布

假设样本空间定义为

假设解空间为线性函数(简化为只有一个变量x)

如何求解上述房价的拟合函数F(x,y)?

这里因为预先假设了问题解空间为线性空间,所以采用均方差损失函数

通过样本迭代计算出minLoss的过程.

上述损失函数的几何特性以为极限在下,向上开口的曲线,只需要计算曲线底部的Loss函数对应的f(x)表达式就可以得到目前为止最优的Loss函数。

整个过程需要选择一个初始位置,不断的通过微分迭代调整下降的方向,直到达到这个“最底部”。整个过程类最直接的方式是沿着梯度反方向逐步向下尝试,类似于下山,俗称梯度下降法。

计算过程如下:

展开Loss针对三个模型变量a0,a1的偏导数:

引入迭代次数k,每一次迭代a0,a1都会向着梯度的反方向前进一小步α

扩展为多变量时

则迭代函数为

局部最优问题

[简易说明]针对信号的一个叠加计算,使得输出的结果更加平整和容易理解,最早是用来对雷达波进行噪声过滤。在图形图像处理中,使用离散卷积计算叠加使得生成一个新的图片。离散卷积的计算公式如下:

卷积计算的原理

神经元定义

神经网络定义

基本的神经元网络形式,由有限个神经元构成,所有神经元的输入向量都是同一个向量。由于每一个神经元都会产生一个标量结果,所以单层神经元的输出是一个向量,向量的维数等于神经元的数目。

[我的归纳观点]神经网络模型认为人工提取特征的步骤是多余的,因为非常依赖算法工程师对于样本分布特性、领域建模和解空间的理解经验。人工筛选制造特征的过程会丢失大量的信号,因为每一个像素点都有可能对结果产生影响,谁也不能保证常见的haar特征枚举了全部的人脸特点,谁也不能保证尺度变化有没有丢失关键信号。唯有让所有像素点都参与决策计算,然后让模型计算出每个像素点对应的系数(可能大部分为0)。但是剩下的显著信号,就是这组样本空间中最显著的特征,这种方式比人工定义的Haar特征更靠谱。因此诞生了BP神经网络的模型算法,因为其全连接的特性很像人类大脑神经元树突全连接的特性,因此命名为神经网络模型。在14年之前其他模型的学者所鄙视,认为其推理过程严重缺乏可解释性和数学的理性,全部依赖概率论,产出结果收敛性也不稳定,所以也被称为一把梭炼丹器,练出来的是神丹还是废丹完全看随机的效果。当年由于算力的不足,备受各种鄙夷的指责。我曾经不止一次听到各个导师臭骂研究神经网络的学生。

[我的归纳观点]理论上神经网络模型层次越深效果越好,但是由于微分逼近的特性很有可能造成梯度消失(参考所有不可导的方式)从而让一个关键的神经元在前几层就失去了参数效果;也有一些不重要的神经元由于梯度的叠加,被放大的无数倍,最终成为了噪声点。一切的一切,都在Microsoft的ResNet残差神经网络模型提出后得到了有效的解决:引入了残差块(residualblock)的概念,可以绕过某一层计算,直接输入到下一层,避免了过多计算弱化或者过多叠加废信号。由模型在反向传播计算中选择是否绕过,有效的抑制了微分梯度下降法本身的梯度计算缺陷问题。

[池化层]降维:1024*1024*RGB3通道的图形被压缩成为200像素的图像依然不影响视觉效果,狗还是狗、猫还是猫。

针对信号进行放大和过滤计算,如果一个卷积层的output是负值,那么它一定会影响模型的稳定性;如果它数量级过大,同样对下一层的系数影响巨大。所以每层计算后都需要使用激活函数判断output是否、如何进入下一层的计算。

ReLU家族激活函数:减少负数的影响

Sigmoid系列:平滑、易于求导

训练过程中随机丢掉一定量的神经元,防止出现过拟合

我们已经了解了CNN网络的基本概念,接下来需要继续了解正向传导和反向传播概念

假设单变量网络输入为x,Y1,Y2为中间层,输出层为Y3,E为均方差损失函数,t为标签。中间存在Y1,Y2中间过程均为标准神经元函数,并且已知整体的信号传导公式如下图所示,

已知数学要素如下:

E真多推导过程中所有参数的梯度矩阵为:

只看偏执值[b3,b2,b1]的偏导数[d3,d2,d1]可以发现损失函数是一层层往前传递并逐层放大,数学上看是这样的

因此从网络传导图上就相当于每一层把损失函数乘以对应的系数,如下图所示

由于偏导数[d3,d2,d1]与原始输入X无关,它们也被称之为局部梯度,表达目标函数对于本层的输入信号的偏导数

当局部梯度计算完毕后,很容易根据输入X计算推理出[w3,w2,w1]的偏导数,称之为参数梯度

根据2.2.3进行梯度下降推理,E为均方差损失函数,α为步长,k为迭代次数

至此,我们已经完整的推理了一个单X输入的3层神经网络的整体模型求解过程。

如果把输入X扩展成4*4的矩阵后,第一层X->Y1的计算表达式为:

向量w1一共是445=80个需要进行梯度下降的参数。其他层的参数就不展开了.

根据3.1章节可知离散卷积的数学表达式为

具体把P展开成像素矩阵,Conv展开成卷积核矩阵后,数学表达式进一步为

计算过程是一个滑动窗口,其中第一个33的像素xij与卷积核向量K点积计算,然后加上偏执值向量B

从线性代数的计算过程来看,其是不是与4.2.5的[Y1]神经元向量表达式类似。

虽然卷积计算和神经网络全连接计算目标不一样,但是从梯度下降和反向传播的数学推理公式来看是一模一样的。所以抽象的表达式f(x)=wx+b可以完全cover如下4个计算过程:

其实还有其他的业务含义,例如Yolo3针对连续视频中的多目标分类结果,都可以融入梯度下降法解决抽象的表达式f(x)=wx+b线性代数和离散微分计算框架中。

由于VGG16模型中只有13个卷积层和3个全连接层能产生权重参数,故VGG16的16来自于13+3。

下图为VGGNet模型有A-E五种结构网络

感受野:ReceptiveField,也就是KernelSize,表达了卷积窗口针对输入矩阵的感知区域大小。

Padding:

所以最终输出22422464个神经元,需要进行梯度下降求解的参数数量为86704128个w+3211264个b1

PIP安装:tensorflow,PIL,matplotlib

python3/Users/caisheng/code/tensorflow/tensorflow/examples/image_retraining/retrain.py--bottleneck_dirbottleneck--how_many_training_steps200--model_dir/Users/caisheng/code/pythonLearn/models/inception_model--output_graphoutput/graph.pb--output_labelsoutput/labels.txt--image_dirimages/pause

THE END
1.养猫者必备的五大知识点11月27日 10:32| 四川在线宠物整治 同堂培训,提升涉外知识产权综合保护质效 11月27日 10:33| 新闻眼学术知识产权 高压线入地生变?户型调整?“书包”归属何处?功德寺小料合集 11月26日 14:54| 房产的那些事儿楼盘 富婆赶紧把房子都送出去就不心烦了! 11月27日 14:15| 老刀99职场 周一热门中概股涨跌不一...https://cj.sina.com.cn/articles/view/5992567656/m1652f536803301gvtw
2.卡通农场新手入门攻略之宠物的必备知识.卡通农场宠物指的是那些需要用礼券购买的狗、猫、马、驴等动物。喂食他们将会有很高的几率出建材,我们知道每喂食两三只左右的宠物就会随机出一个建材。每只宠物喂食间隔大约为8小时,当然驴子例外。 很多亲说驴子好吃懒做,一个小时饿一次,每次消耗一个胡萝卜。虽然一个胡萝卜人人负担得起。但它却不是每次喂食都会...http://www.gamedog.cn/ktnc/gl646831.html
3.宠物知识讲解员宠物知识讲解员并不是一个人,而是由一群喜好宠物,热爱科普的年轻人组成的团队 2024-03-11 13:24 01:01 猫的聪明毛和犟种毛是什么回事? 2024-03-08 20:25 01:12 风干粮和烘焙粮没什么区别! 2024-03-05 19:17 01:10 《主食冻干是如何生产的》 ...https://www.163.com/dy/media/T1599140927131.html
1.犬友启蒙从基础到精通的养狗训狗宝典在购买或领取宠物之前,一定要确保它健康无病,并了解其遗传问题。如果是在动物收容所领取,可以多花时间与宠物互动,以便了解它的性格特点。 四、建立良好的训练基础 训练是提高与狗友之间沟通效率并塑造其行为习惯的关键步骤。在训练开始前,要确定你的目标,比如是否希望你的狗友能够坐在命令下面或者能够走路时保持距离...https://www.wazxzpm.cn/chong-wu-mao/531226.html
2.猫的世界品种探秘揭秘猫咪如何区分各类猫咪其次,听力也是一个关键因素。虽然我们常常认为视觉是最为敏锐的情绪传递手段,但事实上,大多数野生动物(包括大部分家养宠物)都依赖于听力与嗅觉来理解世界。此外,由于不同的品种可能有着不同的叫声或者响应声音模式,所以它们能够通过这种方式间接地判断对方是否属于自己所熟悉或愿意接近的群体。 https://www.ljdikdhg.cn/zhuang-yuan/517860.html
3.宠物饲养的常识,一起去看看宠物是我们生活中的好伴侣,但在饲养宠物之前我们需要了解一些基本常识,以确保它们的健康和安全。 1.选择合适的宠物 在选择宠物时,我们首先需要考虑自己的生活方式和能力。例如,如果您家里没有足够的空间容纳狗或猫,您可以选择较小的宠物,例如老鼠或鸟。 http://yecyd.com/m/?m=detail&id=113583
4.暗黑3死灵法师荆棘反伤流玩法攻略详细搭配一览二、机制讲解 以下罗列一些我认为比较重要的机制: 荆棘伤害是次要词缀,可以出现在除了武器之外的所有装备部位上。 带上畸变复生被动会令宠物造成的荆棘伤害被视为一种“宠物攻击”,这个伤害可以受到套装、传奇宝石、元素伤、元素戒、控场戒、技能伤、全局增伤、特效装备等多种伤害增幅加成。一句话,能加成宠物的就能加...https://www.3dmgame.com/gl/3672932.html
5.java零基础从入门到精通(全)javaSE从入门到精通的二十万字总结(二) javaSE从入门到精通的二十万字总结(三) java优势 健壮性(JVM(C++语言写的一个虚拟的计算机)、GC(垃圾回收机制)) 多线程并发 可移植性/跨平台 java体系 JavaSE:标准版 JavaEE:企业版 JavaME:微型版 1. 入门知识 ...https://blog.csdn.net/weixin_47872288/article/details/118882820
6.小猫领养指南(宠物入门必看)养宠知识小猫领养指南(宠物入门必看) 宠物是我们生活中不可或缺的一部分,而小猫则是最受欢迎的宠物之一。但是,领养小猫需要一些准备工作和技巧,否则可能会带来一些麻烦。本文将为您提供一些关于领养小猫的指南和建议。 准备工作 在领养小猫之前,需要做好充足的准备工作。首先需要准备好猫粮、水盆、猫厕所等基本用品。需要将...https://www.pettb.cn/article-24669-1.html
7.常见宠物入门教程驯养大百科知识攻略饲养关系信任原版其它【预订】台版 快乐狗儿生活训练学跟著专业训练师轻松解决人狗常见衝突增进信任关系饲养攻略知识大百科驯养入门教程宠物书籍风格: 常见 宠物 入门教程 驯养 大百科 知识 攻略 饲养 关系 信任 去购买 收藏 图文详情 本店推荐 图文详情 宠物疾病诊疗与处方手册 第2版第二版 董军 宠物常见病病例分析 ...https://www.zhe2.com/note/606444835934
8....必修课宠物图鉴喂养方式饲养攻略知识大百科驯养入门教程原版其它台版《实用猫咪心理学健康习性日常照顾的猫奴必修课》宠物猫图鉴喂养方式饲养攻略知识大百科驯养入门教程宠物书籍东贩出版2 元优惠券 使用期限: 2024-11-30 去天猫领券声明:此商品数据来源由淘宝官方接口提供,所有交易过程在淘宝或天猫与第三方卖家进行,本网站不参与交易,如有交易产生的疑问请联系天猫卖家【迪赛纳图书...https://m.ftxia.com/item.htm?id=W29PK2yhN9v6N5yBH7
9.揭秘萌宠赛道:9天轻松赚取4800元,AI宠物项目入门指南第四章:AI宠物技术解析– 深入讲解人工智能在宠物领域的应用 第五章:内容创作与营销策略– 教你如何制作吸引人的内容并有效推广 第六章:案例研究– 实际案例分析,学习成功者的经验 结语:总结要点,展望未来趋势 课程亮点 低门槛高回报:无需专业背景,只需热爱生活和小动物,就能开启一段新的旅程。 https://www.turuio.com/vip/ai-project/3476.html
10.训狗基础知识从入门到精通的完整指南训狗基础知识从入门到精通的完整指南 选择合适的犬种 在开始训狗之前,首先要确定自己想要培养的是哪一种犬种。不同的犬种有着不同的性格特点和训练难度。例如,金毛寻回犬由于其友好、乐观的性格以及对人非常忠诚,因此被广泛用于作为家庭宠物和辅助动物。但是,这些犬类通常需要较多的耐心和细心去进行训练。而一些高...https://www.eiopm.cn/chong-wu-xun-lian/468512.html
11.实习教育调查报告范文(精选12篇)传统英语教学重视语法和词汇知识的讲解与传授,忽视对学生实际运用语言能力的培养。因此,英语课堂教学改革以学生为主体,倡导体验、实践、参与、合作与交流的学习方式。以培养学生综合语言运用能力为总目标的教学方式——任务型教学。角色游戏是任务型教学模式之一。所谓角色游戏就是让学生在教学活动中参与各种游戏活动,在各种...https://www.yjbys.com/shixi/shixibaogaofanwen/1074192.html