r语言统计分析方法(用R语言做数据分析)
r语言统计分析方法(用R语言做数据分析)
2024-05-29 10:56:24  作者:我是你的人  网址:https://m.xinb2b.cn/know/twb286292.html

在置信度一定的前提下置信区间的长度越短,其精度越高,估计也就越好实际情况中,通常是给定一定的置信度,求尽可能短的置信区间,下面我们就来说一说关于r语言统计分析方法?我们一起去了解并探讨一下这个问题吧!

r语言统计分析方法(用R语言做数据分析)

r语言统计分析方法

在置信度一定的前提下置信区间的长度越短,其精度越高,估计也就越好。实际情况中,通常是给定一定的置信度,求尽可能短的置信区间。

均值的区间估计

在《每天一点统计学——构建置信区间》这篇文章中已经介绍过置信区间,现在使用R语言来完成置信区间的计算。计算均值的置信区间,需要分为总体方差已知和总体方差未知两种情况,下面是均值置信区间的计算函数(程序名:interval_estimate1.R)

interval_estimate1<-function(x,sigma=-1,alpha=0.05){

n<-length(x);

xb<-mean(x);

if(sigma>=0){

tmp<-sigma/sqrt(n)*qnorm(1-alpha/2);

df<-n;

} else {

tmp<-sd(x)/sqrt(n)*qt(1-alpha/2,n-1);

df<-n-1

}

data.frame(mean=xb,df=df,a=xb-tmp,b=xb tmp);

}

在程序中,x是来自总体的样本数据,sigma是总体的标准差,当标准差已知时,输入相应的值,程序采用正态分布计算区间端点,当标准差未知时,输入项可缺省,程序采用t-分布计算区间端点。aplha是显著性水平,缺省值为0.05.函数以数据框的形式输出,输出的内容有:样本均值mean,自由度df和均值区间估计的上下限a、b。

例子:某工厂生产的零件长度X被认为服从N( μ,0.04),先从该产品中随机抽取6个,其长度的测量值如下(单位:毫米)

14.6,15.1,14.9,14.8,15.2,15.1

试求该零件长度的置信系数为0.95的区间估计

解:输入数据,调用函数interval_estimate1()

> source("interval_estimate1.R")

> X<-c(14.6,15.1,14.9,14.8,15.2,15.1)

> interval_estimate1(X,sigma = 0.2)

得到

mean df a b

1 14.95 6 14.78997 15.11003

因此,该零件长度的置信系数为0.95的区间估计[14.79,15.11]

例子:为估计一件物体的重量μ,将其称了10次,得到的重量(单位:千克)为:

10.1,10,9.8,10.5,9.7,10.1,9.9,10.2,10.3,9.9

假设所称物体重量服从N(μ ,σ^2),求该物体μ置信系数为0.95的置信区间。

解:输入数据,调用函数interval_estimate1()

> source("interval_estimate1.R")

> Y<-c(10.1,10,9.8,10.5,9.7,10.1,9.9,10.2,10.3,9.9)

> interval_estimate1(Y)

得到

mean df a b

1 10.05 9 9.877225 10.22278

因此,该物体μ置信系数为0.95的置信区间为[9.87,10.22]

再使用R语言的t.test()检验函数完成相应的区间估计工作:

> t.test(Y)

One Sample t-test

data: Y

t = 131.59, df = 9, p-value = 4.296e-16

alternative hypothesis: true mean is not equal to 0

95 percent confidence interval:

9.877225 10.222775

sample estimates:

mean of x

10.05

得到了相应的区间估计函数[9.88,10.22]和其他一些信息。t.test()函数得到的区间估计与我们编写的函数得到的区间估计是相同的,从这里可以帮助大奖了解t.test()函数的计算过程。

方差的区间估计

计算方差的置信区间,需要分为总体均值已知和总体均值未知两种情况,下面是方差置信区间的计算函数(程序名:interva_var1.R)

interval_var1<-function(x,mu=Inf,alpha=0.05){

n<-length(x)

if(mu<Inf){

S2<-sum((x-mu)^2)/n;

df<-n;

}else{

S2<-var(x);

df<-n-1

}

a<-df*S2/qchisq(1-alpha/2,df);

b<-df**S2/qchisq(alpha/2,df);

data.frame(var=S2,df=df,a=a,b=b)

}

在程序中,x是来自总体的样本数据,mu是总体的均值,当均值已知时,输入相应的值,程序采用自由度为n的卡方分布计算区间端点,当均值未知时,输入项可缺省,程序采用自由度为n-1的卡方分布计算区间端点。aplha是显著性水平,缺省值为0.05。函数以数据框的形式输出,输出的内容有:样本方差var,自由度df和方差区间估计的上下限a、b。

例子:为估计一件物体的重量μ,将其称了10次,得到的重量(单位:千克)为:

10.1,10,9.8,10.5,9.7,10.1,9.9,10.2,10.3,9.9

下面用区间估计的方法计算这次测量的测量误差,

>#输入数据,调用编写好的程序

> source("interval_var1.R")

> X<-c(10.1,10,9.8,10.5,9.7,10.1,9.9,10.2,10.3,9.9)

>#作方差的区间估计,如果均值为10

> interval_var1(X,mu=10)

var df a b

1 0.055 10 0.0268513 0.3495597

>#作方差的区间估计,如果均值未知

> interval_var1(X)

var df a b

1 0.05833333 9 0.02759851 0.420957

当均值已知(μ =10),其方差的区间估计为[0.0268,0.169],当均值未知时,其方差的区间估计为[0.0276,0.194]。从计算结果来看,在均值已知的情况下,计算结果更好一些。

  • 武汉武大校园樱花树(番职院百名校友认植樱花树)
  • 2024-05-29番职院百名校友认植樱花树4月10日,广州番禺职业技术学院春意正浓,承载着数百名老师和校友涓涓爱心的96棵樱花树被一一种下,为美丽的校园平添了一抹春意据悉,该校拟按3A级景区对校园进行高起点规划建设校友们听到这一消息立即策划发。
  • 世界上前五名最毒的海蛇(世界上最毒的蛇)
  • 2024-05-29世界上最毒的蛇蛇在五毒中,向来是许多人都害怕的一种,被毒蛇咬不但非常的痛,得不到及时治疗还可能丧命今天为大家介绍的裂颊海蛇,可以说是世界上最毒的蛇了,它们比眼镜蛇还要读8倍但是比较奇特的是,被它们咬后并不疼痛,但是。
  • 80只小狗被虐待(印度两名护理系女生残害16只幼犬)
  • 2024-05-29印度两名护理系女生残害16只幼犬1月15日,印度加尔各答两名护理系女学生因虐狗被捕一段此前在视频网站流传的视频中,这两名女生用竹棍不停地轮流殴打一只小狗,小狗疼得发出撕心裂肺的惨叫,直到头部被击中后陷入昏迷随后,女生拎起小狗离开,两。
  • vivo新手机如何传输数据(VIVO官方出品全平台可用)
  • 2024-05-29VIVO官方出品全平台可用本期内容在日常工作中,手机和电脑、手机和手机之间传输文件是一个非常普遍的需求,而使用微信、QQ等工具不仅耗费网络流量,也无法完成大量或大型文件的传输共享虽然之前也分享过类似的软件,但是如果与今天的这款。
  • 慕容复就是这么酷(温文尔雅亦正亦邪)
  • 2024-05-29温文尔雅亦正亦邪在演艺圈有两位张国强,一位是《士兵突击》的连长高城,另一位则是黄日华版《天龙八部》的慕容复今天我们就来一起看看香港TVB艺员张国强的演艺人生张国强,1956年出生于香港,排行老五,居住在古惑仔陈浩南管。
  • 魔道祖师羡羡回忆杀(评选最想恋爱的魔道人物)
  • 2024-05-29评选最想恋爱的魔道人物导语:哈咯大家好,欢迎来到圆子的魔道时间本期要聊的话题是魔道人物,评选少女最想恋爱的魔道人物,忘羡人气滑坡令人大跌眼镜《魔道祖师》里面有不少的杰出青年,他们或高冷淡漠,或活泼跳脱,或傲娇有趣,每一个人。
  • 芝香麻蓉包如何做(美味芝香麻蓉包如何做)
  • 2024-05-29美味芝香麻蓉包如何做芝香麻蓉包的用料:中筋面粉200g、温水100g、芝麻粉(熟芝麻打的)5g、酵母3g、盐3g、奶粉5g馅儿:芝麻粉35g、白砂糖10g、炼乳、植物油把材料5克芝麻粉、面粉、温水、酵母、盐混合(酵母和盐。
  • 生姜洗头水真的会脱发(脱发就用生姜水洗头)
  • 2024-05-29脱发就用生姜水洗头不管是工作的巨大压力,还是年龄的增长,这些都有可能导致你的头发脱落不想让地方支援中央的方法可不是只有戴头套这一个方法哟,你还可以试试中医专家推荐的以下4个偏方哟!生姜水洗头烧水时放人几片生姜,烧好后将。
  • 开辟是什么意思(开辟解释)
  • 2024-05-29开辟解释开辟,汉语词汇,动词拼音:kāipì,释义:指宇宙的开始古代神话,谓盘古氏开天辟地开发;开拓开创;创立开启5打开通路开辟是指打开通道;开拓扩展开辟强调从无到有地打通、创建如:湖南卫视开辟钻石独播剧场。
  • 童年时光儿童影像美学馆(为童年重构传统之美)
  • 2024-05-29为童年重构传统之美2022年国际儿童图书日的主题是“故事就像翅膀,助您每天翱翔”献词作者:[加拿大]理查德·范·坎普海报设计:[加拿大]朱莉·弗莱特■本期主题·儿童阅读与传统文化4月2日,是国际儿童图书日,也是丹麦童话。
  • 肚子胀气是怎么导致的(肚子胀气是什么原因引起的)
  • 2024-05-29肚子胀气是什么原因引起的很多人都有过肚子胀的情况,肚子胀起来很难受,连饭都吃不下那么,胀气是什么原因引起的呢?有哪些方法能够改善这一情况?1、胃肠道疾病如消化性溃疡、胃炎、肠阻塞、肠套叠、肠胃道肿瘤等,容易累积肠气而导致胀气。