物理研究与机器学习(薛定谔的滚与深度学习中的物理)
物理研究与机器学习(薛定谔的滚与深度学习中的物理)
2024-09-27 01:55:24  作者:鲂肆青春  网址:https://m.xinb2b.cn/know/fva427369.html


1 新智元专栏


最近朋友圈里有大神分享薛定谔的滚,一下子火了,“当一个妹子叫你滚的时候,你永远不知道她是在叫你滚还是叫你过来抱紧”,这确实是一种十分纠结的状态,而薛定谔是搞不清楚的,他连自己的猫是怎么回事还没有弄清楚。虽然人们对于薛定谔头脑中那只被放射性物质残害的猫的生死一直众说纷纭,斯特恩·盖拉赫却在实验中,实实在在看到了,我们身处的这个物理世界的量子性,也就是既生又死、既真又假、既梦又醒、既粒又波、既此又彼的存在,按照老子的说法是,玄之又玄,众妙之门。

量子性是这个世界已知的基本特征,未来的世界是我们的,也是你们的,但归根结底是量子的:通讯将是量子的,计算将是量子的,人工智能也将是量子的。这个物理世界运行的基本逻辑,决定了我们身边的一切。不要再纠结是庄周做梦变成了蝴蝶、还是蝴蝶做梦变成了庄周,不要再迷惑南科大朱老师的物质意识的鸡与蛋的问题,拿起你的手机使劲往地上一摔,你就知道这个世界是客观的还是主观的了。

当然量子性不一定是终极真理,还有许多神秘的现象需要解释,比如有鬼魅般超距作用的量子纠缠。但要相信,从牛顿到麦克斯韦,从爱因斯坦到波尔,人类不断了解和认知这个世界的本质,比如能量守恒,比如不可逆的熵增,比如质能方程,比如量子性。这些物理的本质渗透到周遭的方方面面,而火热的深度学习,学的就是现实生活的事物,通过观测推演获取这些事物的内在逻辑,因而是处处遵从这些物理原理的。

大部分的现代神经网络算法都是利用最大似然法(Maximum Likelyhood)训练的,IanGoodfellow 与Yoshua Bengio更是在他们著的《深度学习》一书中详述了利用香农的信息熵构建深度学习损失函数的通用形式:

这些神经网络“似”的什么“然”呢?损失函数中的条件概率、信息熵向我们传达一个怎样的思想呢?在《迷人的数据与香农的视角》(http://mp.weixin.qq.com/s/qgWU6qbEsgXP6GKTVvE6Hg)一文中,我曾经讨论过香农熵与热力学熵的关系:“每一个热力学系统对外表现出宏观的特征,温度、压力、体积等”,“而其内部却是由无数不确定位置、速度、形态的分子原子组成”,“那些无约束,充分发展了的随机变量,达到了势能最低的稳定状态”,对外展现的信息由此势能最低状态的概率分布决定。换种形式,可以将该状态的概率分布的对数,定义为此系统携带的信息量,也就是香农熵。所以这里“似”的“然”就是一种最低势能状态,或者说对外展现出最大信息熵的状态。

而这个最大似然,不是没有条件的,注意到“充分发展”这个说法了吗?“充分发展”的系统是一种相对稳定的系统。我在《站在香农与玻尔兹曼肩上,看深度学习的术与道》(http://mp.weixin.qq.com/s/T6YWQY2yUto4eZa3lEgY3Q)文中强调过,“通过训练寻找这些概率分布函数,其中隐含着一个基本假设,就是系统是处于相对稳定状态的,一个急速演进中的开放系统,概率的方法应该是不适合的”,“又比如玻尔兹曼机,基于哈密尔顿自由能的分布其实都是有隐含的系统相对稳定假设的(玻尔兹曼分布是“平衡态”气体分子的能量分布律)。对于非稳定系统,就得求助于普利高津了”。所以使用诸如RBM(Restricted Boltzmann Machines)之类的深度学习算法的时候,我们首先需要研究一下问题域是不是相对稳定的。

上文中提到的“玻尔兹曼分布”,是描述理想气体在受保守外力作用、或保守外力场的作用不可忽略时,处于热平衡态下的气体分子按能量的分布规律:

这里的 q 叫做配分函数(Partition Function),就是系统中粒子在不同能量级上的分布,它是连接微观粒子状态与宏观状态的桥梁,是整个统计力学的核心。不仅对于气体粒子,玻尔兹曼分布同样被证实适用其他微观到宏观的状态演化,比如著名的Ising Model。Ising Model最初是用来解释铁磁物质的相变(磁铁加热到一定温度以上出现磁性消失)的,模型标定每个小磁针两个状态( 1 -1),所有N个粒子的状态组合是一个"配置",则系统共有2的N次方个"配置",该系统的数量众多“配置”的不同能量级分布服从“玻尔兹曼分布”:

因模型简单与高度抽象,IsingModel被广泛应用于自然科学与社会科学等众多领域。如果将小磁针看作神经元,磁针状态看作激发与抑制,Ising Model 也可以用来构建深度学习的Hopfield模型,或者玻尔兹曼机 。Hopfield Associative Memory (HAM)是经典的神经网络,它仅包含显式神经单元,给这些单元赋予能量,经过推导,我们可以得到这个神经网络的配分函数和自由能表达式,看起来是不是似曾相识?

不过HAM模型有不少显而易见的缺点(无法一层层提取潜变量的信息),Hinton因而创造了有隐含神经元的RBM。

在《迷人的数据与香农的视角》与《站在香农与玻尔兹曼肩上,看深度学习的术与道》两文中,我反复介绍了自己的“顿悟”:“事物由不同层次的随机变量展现出来的信息来表达,不同层次上的随机变量携带不同的信息,共同组合影响上一层的随机变量的信息表达,而随机变量对外表达的信息则取决于该随机变量的条件概率分布”。如果要给这个“顿悟”找个科学的解释,最合适就是尺度重整化(ScaleRenormalization)了。Charles H Martin博士2015年在其文章 《Why Deep Learning Works II: theRenormalization Group》提到,在神经网络中引入隐含节点就是尺度重整化。

每次尺度变换后,我们计算系统有效的哈密尔顿能量,作用在新的特征空间(潜变量空间),合理的尺度重整化保持了系统哈密尔顿自由能的不变性。注意这里的能量守恒,它确保了尺度重整化的合理性。每一次尺度变换后,自由能保持不变。F =-lnZ, 这里Z是配分函数(上文的q),是一个能量(不同能级上粒子数)的概率分布,Z不变,即能量的概率分布不变,就是要求潜变量的特征空间中的大尺度“粒子”能满足原来能量的概率分布。重整化群给出了损失函数,也就是不同层的F自由能的差异, 训练就是来最小化这个差异。

这么多的基础理论,展现了深度学习中的无处不在的物理本质。我还可以举几个大家熟悉的例子,激发思考:CNN 中卷积的意义是什么,平滑输入特征对最终的模型为什么是有效的,为什么池化(pooling)很实用?动量(Momentum)优化方法为什么比普通的SGD快,而且适用高曲率的场合? 为什么Dropout是高效、低能耗的 规则化(Regularization)方法?为何Lecun新提出的EBGAN有更好的收敛模式和生成高分辨率图像的可扩展性?不一而足,深度学习实验室应该多欢迎一些物理背景的学者参与进来啊!

人法地,地法天,天法道,道法自然。在女生节、女神节里,对身边可爱、聪慧、善良、温婉、贤惠与伟大的女性同胞多一声祝福,衷心希望男同胞不要收到“薛定谔的滚”!用智慧的头脑,不断重整化我们的认知、态度,让和谐与美好成为最大似然。

作者简介

王庆法,阳光保险集团大数据中心副总经理兼首席架构师、平台部总经理,首席数据官联盟专家组成员,16年在数据库、分布式系统、机器学习以及云计算等领域,从事软件开发、架构设计、产品创新与管理。热衷于基于市场的数据产品的创新与落地。

©️版权声明:本文为新智元原创作品,未经授权请勿转载。如需转载请在后台回复“转载”查看规则。


  • 开封哪个楼盘比较好(6月开封人气楼盘排名)
  • 2024-09-276月开封人气楼盘排名从决定买房开始,就要根据预算情况从区位、价格、配套等因素一步一步筛选楼盘与其茫然的筛选不如看看这份排行榜!看看大家在关注哪些楼盘,说不定会对你选房有所帮助房天下研究院公布了6月开封楼盘热搜排名,数据显。
  • 空开几倍电流才会跳闸(为什么家用电表的额定电流是5A)
  • 2024-09-27为什么家用电表的额定电流是5A很多人都纳闷,家里电表的额定电流只有5A,为什么好几个屋子同时开着空调也不会跳闸,首先我们要说明一点,如果电表的额定电流太小的话,如果实际用电量超出电表额定最大允许值,那么这样只会造成计量不准,误差很。
  • 陈柏霖有没有女朋友(陈柏霖爱上SHE小师妹)
  • 2024-09-27陈柏霖爱上SHE小师妹5月16日,陈柏霖被拍到和小6岁绯闻女友陈庭萱同框,当天两人身穿情侣装,一起现身逛街,一起去吃烤肉,发现有摄影师跟拍后,两人开始分开走,显得很紧张,并快步离开虽然有另一名友人同行,但二人在穿着上似乎很。
  • 云南方言版教程(云南方言速成教学)
  • 2024-09-27云南方言速成教学云南方言作为潞江坝的本土文化之一,深入云南人的骨髓,从谈吐举止之间,你就会发现云南人的风趣幽默,关键就是云南方言用得好!现在大表哥就手把手、嘴对嘴的教大家如何用地道的方言在云南撩妹又撩汉!最接地气的云。
  • 今日立春春暖花开愿人间皆安(莫忘一年之计在于春)
  • 2024-09-27莫忘一年之计在于春别怪小编没提醒你昂~今天真的很!重!要!就在今天我们迎来了“立春”时节(图片来源:漫画家白茶)作为二十四节气之首立春在很多中国人心中都有着不同寻常的意义那么为啥说立春很重要?下面有请几位身处北方的小编。
  • 苏霍姆林斯基让孩子爱上学习(为什么苏霍姆林斯基说)
  • 2024-09-27为什么苏霍姆林斯基说1前几天在浏览腾讯新闻看到这样一则新闻:3月6日16时许,逃亡两年多的四川广安籍男子刘某某落网其实早在半个小时前,办案民警就盯上他了,但由于刘某某和儿子在逛街,民警没有立即实施抓捕落网后,刘某某得知了。
  • 百合木瓜鲍鱼汤的做法(百合木瓜鲍鱼汤怎么做)
  • 2024-09-27百合木瓜鲍鱼汤怎么做主料:木瓜225克、虾仁130克、百合(干)30克、西洋参15克、枣(干)15克、蟹肉60克、鲑鱼60克调料:大葱5克、姜5克、大蒜(白皮)5克、白砂糖10克、江米酒2克、盐2克、植物油40克将新鲜百。
  • nike鞋都有哪些系列(这是最有江湖地位)
  • 2024-09-27这是最有江湖地位诞生37年,「飞马」Pegasus是Nike最具江湖地位的鞋款系列之一每年夏季都有新品升级登场,一直是不少跑者的训练首选最新一代NikePegasus37刚刚发售,定价未变,搭载全新科技配置,性能大幅。
  • 如何去除家具油漆味(该如何去除家具的油漆味呢)
  • 2024-09-27该如何去除家具的油漆味呢菠萝:由于菠萝的粗纤维水果,把它放在房间里,菠萝会自动吸收装修中出现的味道这种方法最大的优点是价格便宜,方便快捷解决装修后,有油漆气味,内部很新鲜醋:这可以视为“装饰后去除油漆的好方法”,这是最常用的。
  • 苗苗苗真名(特评一起苗苗苗苗苗)
  • 2024-09-27特评一起苗苗苗苗苗来源:读特“我们一起打疫苗,一起苗苗苗苗苗”,29日,深圳盐田区一家社康打出的新冠疫苗接种标语火出了圈这句标语化用网络“洗脑神曲”《学猫叫》歌词,“谐音梗”令人忍俊不禁,表意也恰到好处不少网友表示自己。
  • 粤港澳全运会开幕式在哪里(粤港澳将共同承办2025年全运会)
  • 2024-09-27粤港澳将共同承办2025年全运会■7月17日,中华人民共和国第十四届运动会、全国第十一届残运会暨第八届特奥会的圣火采集仪式在陕西省延安市举行新华社发新快报讯记者高京报道据中国政府网消息,昨日国务院办公厅同意广东、香港、澳门承办202。
  • 一杯敬明天一杯敬过往 毛不易(一杯消愁敬明天)
  • 2024-09-27一杯消愁敬明天Chapter.1原本冲着老薛去看《明日之子》,不料被毛不易的一首《消愁》圈了粉他独自坐在台上,像一个举杯喝酒的歌者,诉说着自己的往事,把酒言欢,畅谈心事情歌会听出情绪,摇滚嘻哈会释放天性,而每首民谣。