怎样理解梯度下降(什么是梯度下降法与delta法则)
怎样理解梯度下降(什么是梯度下降法与delta法则)
2024-11-22 07:10:34  作者:默默守侯  网址:https://m.xinb2b.cn/tech/fsi212245.html

马克-to-win @ 马克java社区:防盗版实名手机尾号:73203在单变量的函数中,梯度可简单理解为只是导数。函数f的梯度方向是函数f的值增长最快的方向,最陡的方向。

马克-to-win @ 马克java社区:防盗版实名手机尾号:73203。梯度下降法就是沿梯度下降的方向求解函数(误差)极小值。delta法则是使用梯度下降法来找到最佳权向量。拿数字识别这个案例为例,训练模型的过程通常是这样的。输入为1万张图片,也就是1万个样本,我们定义为D,是训练样例集合,输出为相对应的1万个数字。马克-to-win @ 马克java社区:这就是1万个目标输出(Target),每一个目标输出我们定义为:td ,是训练样例d的目标输出。我们的模型训练的目的是想找出,此人工神经网络模型的参数,比如权向量w 等。要注意,目标输出td是已知的(非变量,比如5这张图,目标输出就是5这个数字),样本也是已知的。马克-to-win @ 马克java社区:参数是未知的。还有什么是未知的?这就需要从训练的过程入手了。训练过程,通常开始时,所有的权向量w都从一个很小的值开始,比如零, 这时有一个实际输出(od是对训练样例d的实际输出)。目标输出和实际输出的差距叫做误差。因为一共有1万个样本,为了消除正负误差相抵,所以我们定义所 有目标输出和实际输出的误差平方和的一半为E。(因为平方的求导会出现2,所以这就是取一半的原因,这样2×(1/2)会使系数消失。)


公式1-1在上式中:


拿 我们这章第一个例子,单个神经元的房子预测神经网络模型为例,不难理解:Od=x0*w0 x1*w1 …xn*wn b,结合前面的分析可知,x0, x1,。。。。。xn都是一个个的样本值, 是已知的。td也是已知的。这样看E是w0,w1,....wn和b的函数。我们的目标就是找到一组权向量(w0,w1,....wn和b)能使E最小 化。拿wi来说,我们可以画一条函数曲线:


马克-to-win @ 马克java社区:防盗版实名手机尾号:73203。公式1-2:之所以是负号, 是因为图中斜率肯定为负值(因为是与x轴正向的夹角)。根据数学中梯度下降法。(delta wi为正,E越来越小)所以我们有下面一个业内著名的式子:


公式1-2伊塔就是著名的学习率,代表纵向(E方向)的变化幅度。(keras optimizers 默认学习率是0.01)


式子中:td已知,xid已知,od是输出,是可以计算出来的代进公式1-3:


公式1-4公式1-4就是大名鼎鼎的delta rule(规则)以上的式子推导是根据批量学习。但理论和实践中,我们也用逐步学习法(也就是不用通过所有样本点的求和,简言之, 求和号直接省略)在前面上一段,我们提到:所有的权向量w都从一个很小的值开始,比如零,通过变化,最后让E达到最小。


公式1-5 拿我们这章第一个例子,单个神经元的房子预测神经网络模型为例,Od=x0*w0 x1*w1 …xi*wi .....xn*wn b来帮助理解以上的两个式子:公式1-4和公式1-5。根据此以上两个式子:我们的神经网络源代码自 己就能写出来。所有的权向量w都从一个很小的值开始,比如零。td,od, xid和伊塔的值都有,delta wi就能算出来。马克-to-win @ 马克java社区:新一轮wi就能求出来。接着再循环往复,直到最后计算出td和od一样,这时,delta wi就恒定为零了,Wi也就都求出来,这不就是我们训练的目的吗?全部到此就结束了,如果实在td和od的差距始终不能为0,那循环到一定轮数也就结束 了。篇幅有限更多请见扩展链接: http://www.mark-to-win.com/tutorial/mydb_ConvoluNeural_WhatIsGradientDelta.html

  • 海淀温泉安置房项目(海淀宝山村回迁安置房项目预计年底完成50)
  • 2024-11-22海淀宝山村回迁安置房项目预计年底完成50周边居民期盼了十年的海淀区宝山村回迁安置房建设项目近期进入提速建设阶段北京青年报记者从项目施工方北京建工机施集团获悉,作为海淀区最后一批棚改回迁项目之一,房屋交付后将用于宝山地区回迁居民定向安置使用,。
  • 手工软皮钥匙包可爱(森系简约牛仔小清新钥匙包)
  • 2024-11-22森系简约牛仔小清新钥匙包hello,大家好,我是萱妈,精致女生的包包里,应该有一个盛世美颜的钥匙包,避免划伤其他心爱的宝贝,也让我们一下就能在包包里找到钥匙今天给大家介绍一款小清新风格的牛仔布钥匙包1.首先将图纸上画好的纸样。
  • 硝酸亚铁溶液的溶质(硫酸亚铁溶液沉淀物)
  • 2024-11-22硫酸亚铁溶液沉淀物硫酸亚铁用途广泛,有着极强的还原性与氧化性,在水处理与花肥应用方面,我们通常的投加方法是将硫酸亚铁配置成硫酸亚铁溶液进行投加,在硫酸亚铁溶液配置好后我们有时会发现溶液里面会有一些黄色或红棕色的絮状沉淀。
  • 淮秀帮的朋友圈怎么制作的(怎么能做出点击过亿的爆款)
  • 2024-11-22怎么能做出点击过亿的爆款淮秀帮御用周星星来打招呼啦淮秀帮,被媒体誉为“华人网络界第一支形成规模的创意配音团队”这支靠兴趣创建起来的团队从2010年开始不间断地生产有趣的配音恶搞视频,2013年正式注册成立公司,成为了一支著名。
  • 网剧推荐甜宠剧有哪些(多部甜宠网剧齐开播)
  • 2024-11-22多部甜宠网剧齐开播齐鲁晚报•齐鲁壹点记者宋说520在上周引来一大批爱情题材电影的扎堆上映,网络平台也凑档开播了一批甜宠剧《月光变奏曲》《清落》《一不小心捡到爱》《雁归西窗月》等甜宠剧率先“发糖”,它们题材类型丰富而且演。
  • 哈工大现在可以用matlab吗(哈工大被美国禁止使用的MATLAB)
  • 2024-11-22哈工大被美国禁止使用的MATLAB近日有消息称,美国已经禁止哈工大、哈工程使用MATLAB,如果不出意外,其他在实体清单中的公司陆续也会被禁止使用MATLAB,不仅是MATLAB,还有更多的美国软件或者含有美国技术的软件会登上被禁用目。
  • 泾阳的特色风景有什么(你所不知道的泾秋之美)
  • 2024-11-22你所不知道的泾秋之美“泾县自汉初置县,迄今已有2100多年历史,有“汉家旧县,江左名区”之称泾县位于安徽省东南部,隶属于宣城市,黄山、九华山和太平湖等“两山一湖”的中心地带,距离黄山、九华山仅有100公里和110公里,紧。
  • 霸气有内涵的女孩名字(霸气有内涵的女孩名字锦集)
  • 2024-11-22霸气有内涵的女孩名字锦集文涵、胤静、清婉、琳琳美瑛、嘉欣、翾文、姝慧安欣、雯钰、颖儿、彩珍沛美、诗涵、盼媚、骊婷菁佳、蒙雨、嘉鑫、婉琳婷奕、丹云、晨霏、逸菲雁儿、滢梅、万贝、玉宸水菲、云虹、馨雯、珊静雪寒、雁香、瑜卿、蕾贝珊。
  • 剖腹产顺产的基本知识(剖腹产优缺点大比拼)
  • 2024-11-22剖腹产优缺点大比拼你的预产期越来越接近,采用何种分娩方式让你不知所措顺产和剖肚产就像高考的选择题一样难,选择前我们先来了解一下两者的优缺点,再做决定顺产分娩有哪些优点呢?顺产分娩是自热分娩,瓜熟蒂落,也是多数孕妇的首选。
  • 三一955k装载机厂家(买装载机这家企业认准三一)
  • 2024-11-22买装载机这家企业认准三一“不到一年时间,最多的一台工作了2300多小时,最少的也有1200多小时,买回来到现在从来没掉链子,装车速度快不说,故障率也很低,这装载机真给力!”提到三一SW955K装载机,在广安桂兴水泥厂担任设备。
  • 烧制大鹅的方法(烧制大鹅的方法分享)
  • 2024-11-22烧制大鹅的方法分享将清理干净的鹅充气至皮肉分离将鹅肚开膛4-5厘米,取出鹅内所有内脏,清洗干净待用将调味料放入鹅的体内,涂抹均匀后平放腌制一小时用鹅尾针将腌制好的鹅开口处缝合好再次充气后放入开水中烫5秒,然后放进清水中。
  • 广电机顶盒有高清的么(广电高清机顶盒免费换)
  • 2024-11-22广电高清机顶盒免费换今天上午十点,在成都市光华北路鹏瑞利广场,由四川广电网络公司推出的公共文化服务正在进行中公共文化服务系列产品可享受电视手机电脑的高清电视,首次办理的用户可免费更换机顶盒后预交一年的费用就可以享受4k高。