数据分析工作每天要面对各种各样的数据,每种数据都有其特定的含义、使用范围和分析方法,同一个数据在不同环境下的意义也不一样,因此我们想要选择正确的分析方法,得出正确的结论,首先要明确分析目的,并准确理解当前的数据类型及含义。

数据剖析中的变量分类(数据剖析中的变量分类法)  数据分析 分类 变量 第1张

数据剖析作业每天要面临各式各样的数据,每种数据都有其特定的意义、运用范围和剖析办法,同一个数据在不同环境下的意义也不一样,因而咱们想要挑选正确的剖析办法,得出正确的定论,首先要清晰剖析意图,并准确了解当时的数据类型及意义。统计学中的变量指的是研讨目标的特征,咱们有时也称为特色,例如身高、性别等。每个变量都有变量值,变量值便是咱们剖析的内容,它是没有意义的,仅仅一个参加核算的数字,所以咱们首要重视变量的类型,不同的变量类型有不同的剖析办法。

变量首要是用来描绘事物特征,那么依照描绘的低劣,有以下两种区分办法:

按根本描绘区分

【定性变量】:也称为称号变量、质量变量、分类变量,总归便是描绘事物特性的变量,意图是将事物区分红互不相容的不同组别,变量值多为文字或符号,在剖析时,需求转化为特定意义的数字。

定性变量能够再细分为:

有序分类变量:描绘事物等级或次序,变量值能够是数值型或字符型,能够从而比较好坏,如喜爱的程度:很喜爱、一般、不喜爱

无序分类变量:取值之间没有次序不同,仅做分类,又可分为二分类变量和多分类变量 二分类变量是指将悉数数据分红两个类别,如男、女,对、错,阴、阳等,二分类变量是一种特别的分类变量,有其特有的剖析办法。 多分类变量是指两个以上类别,如血型分为A、B、AB、O

【定量变量】:也称为数值型变量,是描绘事物数字信息的变量,变量值便是数字,如长度、分量、产值、人口、速度和温度。

定量变量能够再细分

接连型变量:在必定区间内能够恣意取值,其数值是接连不断的,相邻两个数值可作***切割,即可取***个数值。如身高、绳子的长度等。

离散型变量:值只能用自然数或整数单位核算,其数值是接连的,相邻两个数值之间不再有其他数值,这种变量的取值一般运用计数办法获得。

依照准确描绘区分

【定类变量】

丈量事物类别或特色,各类支架没有次序或等级,实际上也便是上面说的无序分类变量,所包括的数据信息很少,只能核算频数和频率,是***层次的一种变量

【定序变量】

丈量事物之间的等级或次序,便是上述的有序分类变量,因为它的变量值能够是数值型或字符型,而且能够反映等级之间的好坏,除了能够核算频数和频率之外,还能够核算累计频率,因而数据包括的信息多于定类变量。

【定距变量】

丈量事物的类别或次序之间的距离,它不光具有定类和定序变量的特色,还能核算类别之间的距离,能够进行加减运算,数据包括的信息高于前两种

【定比变量】 丈量事物类别比值,和定距变量比较,它不光能够进行加减运算,还能够进行乘除运算,包括的数据信息最多,是***级的变量。

上面这四种变量能够从浅到深准确的描绘事物,四种变量等级从低到高,高层次变量能够向低层次转化,价值是丢失部分数据信息,可是低层次变量无法向高层次转化,这会得出过错成果。

依照变量的取值区分

前面两种分类办法都是从变量对事物的描绘视点动身进行分类,一旦对事物描绘确认下来,那么变量的取值也就相应确认下来了,比方定性变量的取值只能是某特色下的计数,比方人数、客户数等,因而只能取特定的值,数值是离散的。而定量变量能够取某特色下的恣意值,变量值即可接连也可离散,比方身高、体重、销售额等。接连型数值和离散型数值的剖析办法是不同的,因而从统计学视点,又常常区分为接连型变量和定性变量(分类变量)

关于变量的类型及取值办法,能够概括为下表

数据剖析中的变量分类(数据剖析中的变量分类法)  数据分析 分类 变量 第2张

转载请说明出处
知优网 » 数据剖析中的变量分类(数据剖析中的变量分类法)

发表评论

您需要后才能发表评论