怎样理解梯度下降(什么是梯度下降法与delta法则)
怎样理解梯度下降(什么是梯度下降法与delta法则)
2024-11-25 06:14:29  作者:默默守侯  网址:https://m.xinb2b.cn/life/fsi212245.html

马克-to-win @ 马克java社区:防盗版实名手机尾号:73203在单变量的函数中,梯度可简单理解为只是导数。函数f的梯度方向是函数f的值增长最快的方向,最陡的方向。

马克-to-win @ 马克java社区:防盗版实名手机尾号:73203。梯度下降法就是沿梯度下降的方向求解函数(误差)极小值。delta法则是使用梯度下降法来找到最佳权向量。拿数字识别这个案例为例,训练模型的过程通常是这样的。输入为1万张图片,也就是1万个样本,我们定义为D,是训练样例集合,输出为相对应的1万个数字。马克-to-win @ 马克java社区:这就是1万个目标输出(Target),每一个目标输出我们定义为:td ,是训练样例d的目标输出。我们的模型训练的目的是想找出,此人工神经网络模型的参数,比如权向量w 等。要注意,目标输出td是已知的(非变量,比如5这张图,目标输出就是5这个数字),样本也是已知的。马克-to-win @ 马克java社区:参数是未知的。还有什么是未知的?这就需要从训练的过程入手了。训练过程,通常开始时,所有的权向量w都从一个很小的值开始,比如零, 这时有一个实际输出(od是对训练样例d的实际输出)。目标输出和实际输出的差距叫做误差。因为一共有1万个样本,为了消除正负误差相抵,所以我们定义所 有目标输出和实际输出的误差平方和的一半为E。(因为平方的求导会出现2,所以这就是取一半的原因,这样2×(1/2)会使系数消失。)


公式1-1在上式中:


拿 我们这章第一个例子,单个神经元的房子预测神经网络模型为例,不难理解:Od=x0*w0 x1*w1 …xn*wn b,结合前面的分析可知,x0, x1,。。。。。xn都是一个个的样本值, 是已知的。td也是已知的。这样看E是w0,w1,....wn和b的函数。我们的目标就是找到一组权向量(w0,w1,....wn和b)能使E最小 化。拿wi来说,我们可以画一条函数曲线:


马克-to-win @ 马克java社区:防盗版实名手机尾号:73203。公式1-2:之所以是负号, 是因为图中斜率肯定为负值(因为是与x轴正向的夹角)。根据数学中梯度下降法。(delta wi为正,E越来越小)所以我们有下面一个业内著名的式子:


公式1-2伊塔就是著名的学习率,代表纵向(E方向)的变化幅度。(keras optimizers 默认学习率是0.01)


式子中:td已知,xid已知,od是输出,是可以计算出来的代进公式1-3:


公式1-4公式1-4就是大名鼎鼎的delta rule(规则)以上的式子推导是根据批量学习。但理论和实践中,我们也用逐步学习法(也就是不用通过所有样本点的求和,简言之, 求和号直接省略)在前面上一段,我们提到:所有的权向量w都从一个很小的值开始,比如零,通过变化,最后让E达到最小。


公式1-5 拿我们这章第一个例子,单个神经元的房子预测神经网络模型为例,Od=x0*w0 x1*w1 …xi*wi .....xn*wn b来帮助理解以上的两个式子:公式1-4和公式1-5。根据此以上两个式子:我们的神经网络源代码自 己就能写出来。所有的权向量w都从一个很小的值开始,比如零。td,od, xid和伊塔的值都有,delta wi就能算出来。马克-to-win @ 马克java社区:新一轮wi就能求出来。接着再循环往复,直到最后计算出td和od一样,这时,delta wi就恒定为零了,Wi也就都求出来,这不就是我们训练的目的吗?全部到此就结束了,如果实在td和od的差距始终不能为0,那循环到一定轮数也就结束 了。篇幅有限更多请见扩展链接: http://www.mark-to-win.com/tutorial/mydb_ConvoluNeural_WhatIsGradientDelta.html

  • 读心神探里面的知识(读心神探记忆宫殿是人生捷径)
  • 2024-11-25读心神探记忆宫殿是人生捷径姚学琛是重案组高级督察,他凭借高超的记忆力,屡破奇案,更被大家称为超级电脑但童年时代的姚学琛却是一个记忆很差的人,每次考试门门功课都不及格,常常被人嘲笑童年的姚学琛跟着母亲改嫁,寄人篱下的他常常受到委。
  • 突围里面换脸的是哪个人 突围主角都有原型
  • 2024-11-25突围里面换脸的是哪个人 突围主角都有原型《突围》已经大结局了,对于在这部片中,主角扮演的各个角色在现实中都有原型现实中,每个人在职场中都扮演了特定角色,比片中所演绎得更加精彩,唯一不同的是,影视剧中把时间轴缩短,而现实中时间轴则会拉的很长我。
  • 120帧电影李安(李安新片的120帧4K什么意思)
  • 2024-11-25李安新片的120帧4K什么意思中新网11月5日电日前,CINITY版本影片《双子杀手》粉丝观影会在北京举行现场,华夏电影高格式电影部副经理沈锐为观众解答了关于CINITY版本影片的诸多疑问三年前的《比利·林恩的中场战事》,李安导演。
  • 亚马逊十大3c爆款产品排行(6年选品增长超300倍)
  • 2024-11-256年选品增长超300倍配图来自Canva可画十一月是电商大促扎堆的时间自月初启动以来,亚马逊的“真黑五”大促于11月26日正式进入“巅峰6日”大促阶段,来自亚马逊美英日德四大站点超值优惠的海外品牌正在亚马逊海外购上等着国内。
  • 属于我的感动吉他(正安吉他的幸福)
  • 2024-11-25正安吉他的幸福“我从山村来,带着小吉他……”乍暖还寒三月到,郑传玖弹着改编的《小吉他》,从正安唱到了北京作为全国人大代表,遵义神曲乐器制造有限责任公司总经理郑传玖第五次赴京履行职责履职五年,1800多个日夜,他歌里。
  • 赛博朋克你知道吗(人们不了解的赛博朋克)
  • 2024-11-25人们不了解的赛博朋克视频版:https://www.ixigua.com/i6766164826273088014/门见山的说我们今天来聊聊赛博朋克赛博朋克2077还未发售,却在大多玩家心目中已然封神可以说是当下最受玩家。
  • 盘点火影十大cos 晓组织的cos铺天盖地
  • 2024-11-25盘点火影十大cos 晓组织的cos铺天盖地火影忍者作为一部人气非常高的角色,那cos它的人就不在少数,而火影里人气最高的反派组织那就是“晓”了,而cos晓组织成员的coser也并不在少数,那晓组织里的cos你都见过哪些“特别惊艳”的呢?迪达拉。
  • 光纤连接器是不是就是跳线(光纤跳线及光纤连接器基础知识)
  • 2024-11-25光纤跳线及光纤连接器基础知识现在监控传输、网络传输等越来越多的使用到光纤.但很多工程商对于光纤传输还是存在一定的顾虑,认为光纤传输很神秘很复杂.看过这篇文章后,一定会让你对光纤及其设备有一点了解...上图中为光连接器,常见的是F。
  • 梦到房子塌了(梦到房子塌了什么意思)
  • 2024-11-25梦到房子塌了什么意思梦见房子倒塌是生病的前兆,或是你已经生病了梦见房子倒塌,(周公解梦)也象征着一件烦恼的事被解决了如果家人幸运地躲过去该灾难,说明烦恼的事对你身边的人没有太多影响梦到自己家或者是别人家的房子倒塌,有常见。
  • 豆腐的营养比肉多(豆腐和它天生一对)
  • 2024-11-25豆腐和它天生一对豆腐是我们生活中最为常见的美食,不管是在大街小巷,只要有卖菜的地方一定少不了豆腐其脂肪的78%是不饱和脂肪酸并且不含胆固醇,素有“植物肉”之美称软绵细嫩的日本豆腐搭配鲜嫩爽滑的金针菇,两种层次给味蕾带。