如何用R对连续数据做描述统计

这篇文章将为大家详细讲解有关如何用R对连续数据做描述统计,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

成都创新互联公司网站建设公司一直秉承“诚信做人,踏实做事”的原则,不欺瞒客户,是我们最起码的底线! 以服务为基础,以质量求生存,以技术求发展,成交一个客户多一个朋友!专注中小微企业官网定制,成都做网站、成都网站制作,塑造企业网络形象打造互联网企业效应。

用R做基本描述统计,可选的函数很多,反而显得不那么直接。挑选着学习几个好用的能满足日常分析需求即可。

函数使用


自带summary()
pastecs包stat.desc()

案例数据

employee雇员数据,下载数据自由练习。

如何用R对连续数据做描述统计

练习1

对整个数据集进行描述统计。

   
   
   summary(employee)

结果:

如何用R对连续数据做描述统计

显然这并不是我们想要的,一些分类变量并不适合用summary函数。

练习2

指定单一变量做描述统计

   
   
   summary(employee["salary"])

结果:

如何用R对连续数据做描述统计

练习3

指定多个变量做描述统计

   
   
   summary(employee[c("salary","salbegin")])

结果:

如何用R对连续数据做描述统计

练习4

指定多个变量做描述统计

   
   
   stat.desc(employee[c("salbegin","salary")],norm = T)

结果:

如何用R对连续数据做描述统计

stat.desc()函数使用格式为:
stat.desc(x,basic=TRUE,desc=TRUE,norm=FALSE,p=0.95)

如何用R对连续数据做描述统计

其中的x是一个数据框或时间序列。

若basic=TRUE(默认值),则计算其中所有值、空值、缺失值的数量,以及最小值、最大值、值域,还有总和。若desc=TRUE(默认值),则计算中位数、平均数、平均数的标准误、平均数95%的置信区间、方差、标准差以及变异系数。若norm=F(默认值),则不返回正态分布统计量,包括偏度和峰度(以及它们的统计显著程度)和Shapiro–Wilk正态检验结果。

关于如何用R对连续数据做描述统计就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。


网页名称:如何用R对连续数据做描述统计
转载来于:http://ybzwz.com/article/gpejjj.html