r语言分析数据实例,R语言数据特征分析
r语言分析数据实例,R语言数据特征分析
2024-11-25 01:00:56  作者:循環式溞  网址:https://m.xinb2b.cn/life/lzi254608.html


用统计指标对定量数据进行统计描述,常从集中趋势和离散趋势两个方面进行分析。

平均水平的指标是对个体集中趋势的度量,使用最广泛的是均值和中位数;反映变异程度的指标则是对个体离开平均水平的度量,使用较广泛的是标准差(方差)、四分位数间距。

集中趋势度量

(1)均值

均值是所有数据的平均值。如果求n个原始观察数据的平均数,计算公式为:


有时,为了反映在均值中不同成分所占的不同重要程度,为数据集中的每一个Xi赋予Wi,这就得到了加权均值的计算公式:

作为一个统计量,均值的主要问题是对极端值很敏感。如果数据中存在极端值或者数据时偏态分布的,那么均值就不能很好地度量数据的集中趋势。为了小数少数极端值的影响,可以使用截断均值或者中位数来度量数据的集中趋势。阶段均值是去掉高、低极端值之后的平均数。

(2)中位数

中位数是将一组观察值从小到大按顺序排列,位于中间的那个数据。即在全部数据中,小于和大于中位数的数据个数相等。

将某一数据集X:{X1,X2,...,Xn}从小到大排序:{X(1),X(2),...,X(n)}。

当n为奇数时


当n为偶数时


(3)众数

众数是指数据集中出现最频繁的值。众数并不经常用来度量定性变量的中心位置,更适用于定性变量。众数不具有唯一性。

离散趋势度量

(1)极差

极差=最大值-最小值。极差对数据集的极端值非常敏感,并且忽略了位于最大值与最小值之间的数据是如何分布的。

(2)标准差

标准差度量数据偏离均值的程度,计算公式为:


(3)变异系数

变异系数度量标准差相对于均值的离散趋势,计算公式为:


变异系数主要用来比较两个或多个具有不同单位或不同波动幅度的数据集的离散趋势。

(4)四分位数间距

四分位数包括上四分位数和下四分位数。将所有数值由小到大排列并分成四等份,处于第一个分割点位置的数值是下四分位数,处于第二个分割点位置(中间位置)的数值是中位数,处于第三个分割点位置的数值是上四分位数。

四分位数间距是上四分位数QU与下四分位数QL之差,其间包含了全部观察值的一半。其值越大,说明数据的变异程度越大,反之说明变异程度越小。

下面以餐饮销量数据进行统计量分析,演示代码如下:

> # 读入数据

> saledata <- read.table(file = "../data/catering_sale.csv", sep=",", header = TRUE)

> sales <- saledata[, 2]

>

> # 统计量分析

> # 均值

> mean_ <- mean(sales, na.rm = T)

> # 中位数

> median_ <- median(sales, na.rm = T)

> # 极差

> range_ <- max(sales, na.rm = T) - min(sales, na.rm = T)

> # 标准差

> std_ <- sqrt(var(sales, na.rm = T))

> # 变异系数

> variation_ <- std_ / mean_

> # 四分位数间距

> q1 <- quantile(sales, 0.25, na.rm = T)

> q3 <- quantile(sales, 0.75, na.rm = T)

> distance <- q3 - q1

> a <- matrix(c(mean_, median_, range_, std_, variation_, q1, q3, distance),

1, byrow = T)

> colnames(a) <- c("均值", "中位数", "极差", "标准差", "变异系数",

"1/4分位数", "3/4分位数", "四分位间距")

> print(a)

均值 中位数 极差 标准差 变异系数 1/4分位数 3/4分位数 四分位间距

[1,] 2755.215 2655.85 9084.44 751.0298 0.2725848 2451.975 3026.125 574.15

通过上面代码的运行结果,我们已经得到了餐饮销量数的统计量情况。

相关阅读:

《R语言数据质量分析》

《每天一点统计学——数据集中趋势的量度》

《每天一点统计学——数据分散性的量度》

《每天一点统计学——数据变异性的量度》

  • 天穹怎么购买(天穹购买方法)
  • 2024-11-25天穹购买方法打开王者荣耀,点击界面左侧的“商店”标识“天穹”是由“纯净苍穹”和“原初遗珠”这两件装备合成的点击“攻击”,购买纯净苍穹点击“防御”,购买“贤者的庇护”当“贤者的庇护”被使用过两次后,就会转变为“原初。
  • 输卵管卵巢积水怎么治疗(输卵管炎怎么检查)
  • 2024-11-25输卵管炎怎么检查输卵管和多囊卵巢是怀孕时孕妈关心的,输卵管炎怎么检查,输卵管积水怎么治,多囊卵巢治疗方法有哪些,在试管婴儿备孕之路上,孕妈会经过很多次输卵管和多囊卵巢,可见这两者在孕检的时候的重要性,孕妈关心也不是毫。
  • 好养且好看的宠物兔(公主兔也叫作柏鲁美路兔)
  • 2024-11-25公主兔也叫作柏鲁美路兔网上流行一句女孩子撒娇的话“兔兔这么可爱怎么可以吃兔兔呢”我们不吃兔子那养兔子总行吧在世界上有一种杂交兔叫做公主兔,它本身不是公主,只是被公主喜欢才叫这个名字公主兔出名全因公主喜欢公主兔是一种比较常见。
  • 杜甫的名著是哪些
  • 2024-11-25杜甫的名著是哪些三别,是指《新婚别》、《无家别》、《垂老别》诗人耳闻目睹了惨败后人民罹难的痛苦情状,经过艺术提炼,写成组诗“三别”三吏《石壕吏》、《新安吏》、《潼关吏》三吏作品体现了杜甫的思想核心——儒家的仁政思想,。
  • 俗话说得好秋风起蟹飘香(秋风起蟹脚痒醉螃蟹)
  • 2024-11-25秋风起蟹脚痒醉螃蟹#头条创作挑战赛#作为一个螃蟹爱好者,最近收到了不错的醉螃蟹,正好开箱了尝尝,给大家先探探道,尝尝味外包装朴实无华,比较常规,是小厨娘旗下的产品,外地朋友估计不认识,南京人尤其是江宁人,我估计没有人不。
  • 颈椎反曲的正确方法(减缓颈椎反曲试试这六招)
  • 2024-11-25减缓颈椎反曲试试这六招正常人颈椎呈向后弧形弯曲,生理曲度类似C形长时间低头伏案,会使颈椎曲度变直甚至出现反曲,引起椎间盘、小关节等过早退变,出现颈椎病诸多症状因此,如检查出颈椎反曲,不可忽视下面介绍几个能有效预防和减缓颈椎。
  • 治疗咳嗽的小偏方最有效的(缓解咳嗽的几种实用偏方)
  • 2024-11-25缓解咳嗽的几种实用偏方咳嗽是严重影响我们生活的一种病症除了积极就医治疗之外,我们能不能服用一些偏方来缓解我们的咳嗽呢?下面给大家介绍几种能缓解咳嗽的偏方供大家参考请在医生的建议下服用鲜梨贝母治咳嗽肺痈鲜梨500克,贝母末6。
  • 孩子叛逆的10个表现是什么呢(孩子这些叛逆的行为)
  • 2024-11-25孩子这些叛逆的行为文|好孕姐很多家长在育儿的过程中发现,好端端的孩子,突然有了一些变化,他不再总是乖乖听话相反,有的时候孩子会发小脾气,怎么管也管不了,难道是孩子变叛逆了?最近,表姐家1岁半的孩子,出现一些“叛逆”的行。
  • 手机电竞手机rog手机吃鸡测评(王牌战士新版本来了)
  • 2024-11-25王牌战士新版本来了说到最近非常火爆的手游,《王牌战士》可不能落下,这款多角色的射击类手游自上线以来一直热度不减8月上线,9月更新,王牌战场再度进阶以MOBAFPS著称的《王牌战士》在8月份终于上线,收获了非常多的好评,。
  • 维生素食物排行榜前十名(维生素食物大百科)
  • 2024-11-25维生素食物大百科生活再不易,工作再忙碌,唯有美食不可辜负可就算每天都吃饱喝足,你的身体却还在喊着:不够!什么不够?维生素!●接近85%的18-44岁女性缺乏维生素D●超过80%的中国居民维生素B1和维生素B2摄入不足。