数理统计和概率论的本质一样(概率论和数理统计到底有啥子区别和联系呢)
数理统计和概率论的本质一样(概率论和数理统计到底有啥子区别和联系呢)
2024-11-22 07:13:54  作者:夜如此孤独  网址:https://m.xinb2b.cn/sport/sed518677.html

今天我们就来说说统计学、概率论和数理统计

为什么要说他们呢,

因为这几个字眼大家肯定是已经无数次地碰到过了,但他们究竟代表了什么,以及他们之间的区别与联系,相信大家平时肯定是没怎么关注过,而是更多的混为一谈。

然而今天,随着大数据与数据科学的热火朝天,这几个词重新被大家给予了高度关注,特别是统计学。原因也很自然:分析思维是数据科学的核心思维方式,而分析思维就是关于计算与统计的思维。

统计思维生长的土壤就是概率论和数理统计。

1、统计学

首先说说统计学,关于这个词其实是个历史遗留问题。因为从统计学的发展历史来看,最早的统计学和国家经济学有密切的关系。统计学的英文是“statistic”,其实它是源于意大利文的“stato”,意思是“国家”、“情况”,也就是后来英语里的state(国家),在十七、十八世纪,统计学很多时候都是以经济学的姿态出现的。根据维基百科:

一是随机性,就是说数理统计的研究对象应当具有随机性,确定性现象不是数理统计所要研究的内容。二是有限性,就是说数理统计据以研究的随机现象数量表现的次数是有限的。三是数量性,即数理统计以研究随机现象的数量规律性为主,而对随机现象质的研究为次。四是采用的研究方法主要为归纳法。最后,数理统计通过对小样本的研究以达到对整体的推断都具有一定的概率可靠性。用样本推断总体误差的存在是客观的,但是数理统计不仅重在研究误差的大小,还指出误差发生的可能性的大小。

因此,从数理统计的学科特征来看,数理统计是应用数学的一种,并且是目前最为活跃的分支之一。由此,数理统计从学科划分来说,应属于数学学科,但是其重在应用,而不是纯数学理论或方法的研究,故其采用的方法也就重在归纳法,而不是数学的演绎法。

综上,数理统计的主要特点可以用一句话概括为:数理统计是一门对随机现象进行有限次的观测或试验的结果进行数量研究,并依之对总体的数量规律性做出具有一定可靠性推断的应用数学学科。

4、统计学、概率和数理统计的辨析

看到上面的这些说法,加上几个学科的快速发展和应用,很多时候大家往往都不加区分的将这些概念混淆起来,特别是在应用的时候,很多时候也都无伤大雅。但是,一旦我们深入研究,特别是看国内外相关文献的时候,还是要加以区分的。否则,拿起两本类似书名的书,很可能里面的内容是大相径庭的。

我们先来看看统计学和概率论。

简单来说,概率论研究的是“是什么”的问题,统计学研究的是“怎么办”的问题。

统计学不必然用到概率论,比如用样本均值来表征总体某种特征的大致水平,这个和概率就没有关系。但是因为概率论研究的对象是随机现象,而统计学恰恰充满了无处不在的随机现象:因为要随机抽样。因此概率论就成为了精确刻画统计工具的不二法门。

概率方向更偏数学,统计更多应用。很多大学里的科研,概率和统计都不是一个组(更有甚者,有的大学统计单独成立一个学院,独立于数学学院)因为大家做的东西确实不太一样。

再举例来说,如今火热的金融数学,就属于概率方向的,大家本科的概率论只能算是最基础的课,其他像Stochastic Calculus,Random Model,Markov Chain,Martingale,测度论,以及一直比较火的时间序列分析等等,这些都是学概率方向研究的,不是数学系出身,你几乎很难入门。而统计则更多作为应用的科学,常见的分支有生物统计,医疗统计,经济统计等等。

现在统计学火热一方面是如今各行各业都需要数据分析,大数据更是被吹上了天;另一方面统计入门门槛相对一般数学系专业更低,简单的说,非数学系要求的数据分析,用个SPSS,SAS啥的也就够了,但凡你学过高数,概率论,捣鼓捣鼓也没那么难理解,非数学系了解常见分布,看得懂置信区间,p-value,再来些F-test,t-test就差不多了。当然,数学系的统计就没这么容易了,数学系的统计常见的会研究各种分布,Bayesian统计,神经网络,金融风险,时间序列分析等等,用的软件也肯定是R居多。

Larry Wasserman在他的统计学巨作All of Statistics的序言里有说过概率论和统计推断的区别,如下图所示。


它们之间的区别包括:

概率论是统计推断的基础,在给定数据生成过程下观测、研究数据的性质;而统计推断则根据观测的数据,反向思考其数据生成过程。预测、分类、聚类、估计等,都是统计推断的特殊形式,强调对于数据生成过程的研究。

因此,统计和概率是方法论上的区别,一个是推理,一个是归纳。


打个比方,概率论研究的是一个白箱子,你知道这个箱子的构造(里面有几个红球、几个白球,也就是所谓的分布函数),然后计算下一个摸出来的球是红球的概率。而统计学面对的是一个黑箱子,你只看得到每次摸出来的是红球还是白球,然后需要猜测这个黑箱子的内部结构,例如红球和白球的比例是多少?(参数估计)能不能认为红球40%,白球60%?(假设检验)

而概率论中的许多定理与结论,如大数定理、中心极限定理等保证了统计推断的合理性。做统计推断一般都需要对那个黑箱子做各种各样的假设,这些假设都是概率模型,统计推断实际上就是在估计这些模型的参数。

概率论就好比是给你一个模型,你可以知道这个模型会产生什么样的数据;而统计则是给你一些数据,你来判断是由什么样的模型产生的。


再从小概率事件看看两者的关系:

概率论会说小概率事件必然发生。

因为随着试验次数的增多,该事件会发生的期望终会为1。

统计则倾向于忽略小概率事件或者认为小概率事件不会发生。

例如最大似然估计,估计的就是一个以假设值代替真实值的过程,这个过程一个自然的思想便是认为小概率不会发生,所以我们有充足的理由认为估计是可接受的。

再来看看数理统计与统计学之间的差异,主要有以下几方面:

从其研究目的来看,两者都重在揭示总体现象的数量规律性,而统计学更声称要以对总体现象的定性认识为基础。从其研究的途径来看,数理统计希望通过对总体部分个体的数量特征的研究,以达到对总体相应数量特征的认识;而统计学既希望通过对构成总体的全部个体的数量特征的研究,以达到对总体相应数量特征的认识,同时也希望能通过对构成总体的部分个体的数量特征的研究,以达到对总体相应数量特征的认识。从其研究的手段来看,数理统计主要依赖于小样本特征值统计分布的数学原理来推断总体的相应特征值;而统计学或者说推断统计学主要依赖于大样本特征值统计分布的数学原理来推断总体的相应特征值。从其研究的主要范围来看,数理统计侧重于对样本数据的定量分析;而统计学不仅重视样本数据的定量分析,而且重视对所获得的总体全部数据的定量分析,同时,重视数据收集方法、数据整理方法的研究。从其利用样本数据对总体进行推断的数理机理而言,概率论是其共同的基础。特别是作为统计学基本方法之一的大量观察法,其数理基础正是概率论中的大数定律;统计学中用大样本可以方便地推断出总体特征的数理基础正是概率论中的中心极限定理,而无论是大数定律还是中心极限定理也都是数理统计的根基。

从上述数理统计与统计学的特点及其比较,可以清楚地看到,随着现代统计学的发展及其在社会政治经济生活中发挥作用越来越大的趋势,数理统计研究问题的理念及其方法已对统计学的发展产生重要的革命性影响,但是,数理统计与统计学还是两门差异较大的学科,不可能简单地加以混淆。

4、统计是数学吗?

最后再来说说统计是不是数学的问题。这个问题如果问上世纪末某统计大牛A,他会很坚定的说统计是数学。如果又问某著名大学统计系领导B,他会不屑的答曰,不算,因为统计是微积分。

我们在学习统计的时候,特别是在推导概率分布的时候会发现,统计上用微积分证明的地方太多。但是统计对于数学的其他方面,比如拓扑,数论等基本完全不涉及。因此,首先数学是比统计更加宽泛的学科。

第二,统计和概率论是平行的两个不同的理念。概率论是假设你已经知道了整体然后对一个事件的发生概率进行计算。而统计是指你不完全理解整体,你的目的就是为了理解整体的。但是整体的数量太大。所以你退而求其次,用抽样的方法来获得理解整体。但是抽样就意味着有误差,而误差有的时候会因为你抽样方法的选择或者随机事件的爆发而变的很大。这点在数学上很多人不能接受,数学更讲究精确。而且对于很多学数学的人来说,只有对或者错。例如抽象代数。所以数学上有一部分人不喜欢统计,会说统计是变魔术。

总的来说,一个可以接受的观点是:概率论是纯数学,数理统计是应用数学,而统计学则是借鉴了概率论和数理统计的一门超级应用学科(数学)。

随着大数据和数据科学时代的到来,这几个学科将会有什么样的进一步发展,让我们拭目以待。

最后给大家留一个小问题:你能区别probabilistic、random和stochastic吗?

  • 英语中如何正确使用标点符号(最简语法解锁英语标点)
  • 2024-11-22最简语法解锁英语标点Hi,大家好,我是造物家每天为渴望用英语的人群分享有趣的英语资料,如果大家喜欢的话,就点点关注我们一起进入英语的世界你的转发,将是对我们最大的鼓励,O(∩_∩)O谢谢英语标点符号的正确用法“基础版||。
  • 碳粉是什么(碳粉简介)
  • 2024-11-22碳粉简介墨粉,也叫碳粉,是激光打印机中用于在纸张上成像定影的粉末状物质黑色墨粉由粘结树脂、炭黑、荷电控制剂、外添加剂等成分组成彩色墨粉中还需要添加其他颜色的颜料等墨粉在打印时,由于树脂中残留的单体受热挥发,会。
  • 富人持债的俗语(每日一寓出人头地)
  • 2024-11-22每日一寓出人头地【出人头地的故事】苏轼,字子瞻,号东坡居士眉州眉山(今四川眉山县)人他的父亲苏洵和弟弟苏辙都是北宋有名的文学家,被人们合称为“三苏”,而且都一起列入“唐宋八大家”之中苏轼小时候,天资聪颖,由于书读得多。
  • vegetables怎么读(vegetables英语怎么读)
  • 2024-11-22vegetables英语怎么读vegetables的英语发音:英[ˈvɛdʒtəb(ə)lz],美[ˈvɛdʒtəbəlz]vegetables:n.蔬菜;植物人;生活单调乏味的人例句:Freshfruitandvegetable。
  • 奶油草莓与普通草莓区别(被称为水果界女皇)
  • 2024-11-22被称为水果界女皇丨撩你的少女心丨-风物君语-又到了一年里可以放肆吃草莓的季节鲜美红嫩、香甜多汁每一颗都是实力诱惑撩着广大吃货快要爆炸的少女心让你一口一个,根本停不下来草莓君何以如此“撩人”?要知道,它摸爬滚打到今天这。
  • 遵义城区春节免费停车(遵义城区元旦出行交通安全提示)
  • 2024-11-22遵义城区元旦出行交通安全提示2022年元旦假期即将到来根据安排2022年元旦假期放假时间为1月1日—1月3日新年的第一个小长假你准备出行吗?2022年元旦放假时间为1月1日至3日根据相关规定,高速公路免费仅针对春节、清明节、劳动。
  • 韩国经典必看电影(韩国经典影片推荐)
  • 2024-11-22韩国经典影片推荐《王道》1/3:黑帮小弟爱上了大哥的女人李焕加入黑帮的第一天,就被老大的女人深深吸引,但他并没有因此送命,反而得到了老大的赏识李焕的打架实力,让要债公司的老板长河刮目相看虽然李焕曾殴打了手下,但长河并。
  • 好漂亮的樱桃红(樱桃红了好看但不好吃)
  • 2024-11-22樱桃红了好看但不好吃海西晨报记者仇慧亮厦门市植物园樱桃树上结满了果实记者陈理杰摄厦门市植物园樱桃树上结满了果实记者陈理杰摄桃花梅花叶志鹏摄人间四月天,最美樱桃红近日,厦门市园林植物园南山门附近的樱花谷内漫山山樱褪去花衣,。
  • 创新推动经济发展的科学性(新时代经济发展的科学指引)
  • 2024-11-22新时代经济发展的科学指引经济工作是党和国家的中心工作,做好经济工作是党治国理政的重大任务我国经济正处在转变发展方式、优化经济结构、转换增长动力的攻关期面对世纪疫情和百年变局交织叠加的严峻复杂形势,面对我国经济发展面临的需求收。
  • 办公室瘦腿的最快方法(办公室瘦腿的最快方法介绍)
  • 2024-11-22办公室瘦腿的最快方法介绍坐在椅子上,伸直双腿让脚与地面保持一定的距离,把脚尖伸直,保持这个姿势5秒钟脚尖伸直,脚面向上呈90度角,让脚后跟和小腿肚的筋伸展开,保持5秒钟用脚踝的力量旋转双脚,同时可以拉紧小腿肚的肌肉在上楼梯时。
  • 语文阅读题分类及答案(语文阅读理解7招纵观全文)
  • 2024-11-22语文阅读理解7招纵观全文大家好,我是专注语文阅读理解,科学提分的少明老师!专注做一件事,死磕语文阅读理解!让您的孩子成为阅读理解尖子生!语文阅读理解,7招纵观全文,把握主旨!第1招理清文章理清文章的思路文章的每一段、每一句话。
  • 2023款东风风行SX6上市(2022款东风风行SX6上市)
  • 2024-11-222022款东风风行SX6上市众所周知,每样商品所面对的消费群体都有所不同,我们就拿在日常出行中非常重要的家用车来说,对于那些动辄几十万起的豪华品牌车型,它们的消费群体多为城市精英人群,用途则只是日常代步;把目光向下看到十几万级,。