以下文字有对应的视频,不想阅读文字的小伙伴请移步至数字的故事(二)杨辉三角与路径数量
这是一个长长的故事,让我们一起来完成它!
(先阅读本故事第一章体验更佳)
05 概率在上一章我们谈到了杨辉三角最基本的属性是“每一个数字都是上一行与之相邻的两个数字之和”,同时我们也充分认识到这一属性带来的外在展现就是:杨辉三角新一行的产生来自于上一行所有数字的错位相加。
“错位相加”是一个法宝,接下来我们将把它运用在抛硬币这个游戏中。
抛硬币是讨论概率问题时经常用来举例的游戏,因为大家都认可关于抛硬币的假设:结果中出现正面和反面的可能性是一样的。这也就是我们所说的等概率事件。
一枚硬币抛多次和同时抛多枚硬币是一样的。如果同时抛了 10 枚硬币,会出现 11 种不同的情况:硬币正面朝上的数量分别是 0、1、2、...、10 。我们当然知道这 11 种情形出现的概率是不一样的。每一种情形出现的概率究竟等于多少呢?
为了回答这个问题,可以从少量硬币开始找规律。以 3 枚硬币为例,把每一枚硬币的结果都写出来,是这样的:
正正正、正正反、正反正、正反反、反正正、反正反、反反正、反反反
因为每一枚硬币出现正和反的概率是一样的,所以这 8 种情形出现的概率是一样的。统计每种情形的数量是:
3正0反-1、2正1反-3、1正2反-3、0正3反-1
这时,再多抛一枚硬币,它出现正面和反面的可能性是一样的。这一枚硬币如果是正面,上面的统计结果就成为:
4正0反-1、3正1反-3、2正2反-3、1正3反-1
这一枚硬币如果是反面,统计结果成为:
3正1反-1、2正2反-3、1正3反-3、0正4反-1
很明显,“合并同类项”的过程也是“错位相加”的过程:
“错位相加”的游戏在上一章已经多次出现,杨辉三角每一行产生,都是上一行的数字错位相加得到的。所以我们确定的知道,抛硬币各种情形出现的统计结果就是杨辉三角。
比如说,杨辉三角的第 8 行的各个数字就是同时抛 8 枚硬币,出现 9 种情形(反面朝上的枚数分别是 0、1、2、...、8)的统计结果。
(再次友情提醒:我们称杨辉三角的首行为第 0 行。)
如果要表示各种情形出现的概率,我们就可以用到另一种形态的杨辉三角:
在这种形态的“杨辉三角”中,显示了抛 n 枚硬币出现 m 枚反面朝上的概率是这样一个分数:分母是,分子是杨辉三角的第 n 行第 m 个数字。
(友情提醒:我们称杨辉三角的首行为第 0 行,每行的首个数字为第 0 个。)
或许有人在一些游戏场所见过这样的装置:木板上均匀地钉着上下交错的一排排钉子,从上方空档处放一个小球往下滚,小球将从最下方的某个空档滚出,不同的空档对应放置不同的奖品。
我们通常可以看到经营者会在中间空档下面放相对廉价的奖品,两边空档下面放相对高价的奖品。不管是经营者,还是参与游戏的玩家,大家都知道,小球从中间滚出来的几率要高于从旁边滚出来的几率。
与这种游戏类似,有一种叫做“高尔顿板”的数学玩具。玩具中有 3000 颗小滚珠,翻转后将经过一些交错排列的柱子滚向底部,底部有用于统计小滚珠数量的收集槽。
不论重复多少次,这 3000 颗小滚珠的去向总是形成一条几乎一样的曲线。
可以肯定的是,具体到某一颗小滚珠,它每次的去向都有可能不同;即便是落入同一个收集槽,它经过的路径也不大可能是同一条。
接下来我们就聚焦一颗小滚珠,将它可能经过的柱子抽象出来,看看它可能的走向。
小滚珠掉落下来,100%会碰到第一排的柱子,我们记作,当它往下滚,碰到柱子时,假设它往左滚和往右滚的可能性是一样的,那么出现在下一排左右两个柱子的概率就都是。接下来小滚珠又碰到柱子,假设它每次往左往右的可能性都是一样的,刚才有概率在左边的这个小滚珠出现在正对的下一排面两个柱子上的概率就都是,同样的道理也适用于刚才在右边出现的小滚珠,所以中间那个柱子上小滚珠出现的概率就是。于是我们看到在第三排的柱子上,小滚珠出现的概率分别是:。按照同样的推理方式,继续下去,每个柱子上小滚珠出现的概率就依次是。
从上面的推理过程中,我们可以发现,最关键的一点在于:小滚珠在某个柱子上出现的概率是等于它上面一排相邻两个柱子上的概率乘以后相加的结果。
这一个关键的特征和杨辉三角“每一个数字是上一行相邻两个数字之和”的基本属性相吻合,于是我们看到计算出来的概率结果和杨辉三角紧密联系在一起,这就一点也不奇怪了。甚至不用特别的留意,我们就看到了杨辉三角一个明显的特点:每一行都是中间的数字大,首尾的数字小。这当然也符合抛硬币时正反面数量接近的情形概率大,高尔顿板往中间去的小滚珠数量多,这些直觉和分析结果是一致的。
我们用杨辉三角某一行的数字作为纵轴数值,画出来的曲线是这样的,和高尔顿板上的曲线几乎一样。
钟形曲线
这就是大名鼎鼎的“钟形曲线”,在正态分布的统计数据中处处可见。
细心的小伙伴还可以发现,在高尔顿板的上半部分还写有一些数字。仔细看,这些数字恰好排列成了杨辉三角。杨辉三角中的这些数字有什么含义吗?
将视线聚焦在一个小滚珠上,从最上面出发,如果目标是第4排的中间位置,小滚珠究竟要经过怎样的路径才能到达呢?这些路径的数量是多少?让我们一起来数一下,记录过程中用小滚珠是向左还是向右滚动来表示不同的路径。
我们还可以把小滚珠到达其他各个点的路径数量都数出来。不出意料,我们会再次得到杨辉三角。这是因为小滚珠要到达某一点,必须要经过它上面相邻的两个点之一,而且也只能从这两个点之一滚过来。所以,到达此点的路径数量必定等于上一排相邻两点路径数量之和,这一特征又是和杨辉三角的核心属性相吻合的。
于是,我们可以赋予杨辉三角中每一个数字特定的含义:杨辉三角的数字表示从顶点到达其位置的折线路径数量。
(未完待续!)