统计数据 - 数据模式
2018-12-28 10:08 更新
当它们以图形方式绘制时,数据模式是非常有用的。 数据模式通常根据特征,如中心,展布,形状和其他不寻常的属性来描述。 其他特殊描述性标签是对称的,钟形的,歪斜的等。
中央
图形地,分布的中心位于分布的中值。 这样的图表显示,几乎一半的观察在任一侧。 每列的高度表示观察的频率。
传播
分布的扩展是指数据的变化。 如果观测集合覆盖范围较宽,则扩展较大。 如果观察值集中在单个值周围,则扩展更小。
形状
可以使用以下特性描述分布的形状。
-
对称 - 在对称分布中,图形可以在中心处分开,使得每一半都是另一半的镜像。
-
峰数。 - 具有一个或多个峰的分布。 具有一个清晰峰的分布被称为单峰,具有两个清楚峰的分布被称为双峰。 在中心处的单个峰对称分布被称为钟形。
-
偏斜 - 某些分布在图形的一侧可能有多个观察结果。 对较低值的观察值较少的分布被称为偏斜; 而对较低值的观察值较少的分布被称为左偏。
-
统一 - 当观察集合没有峰值并且数据在分布范围内均匀分布时,则该分布称为均匀分布。
不寻常的特点
数据模式的常见异常特征是缺口和异常值。
-
间隙 - 间隙指向没有观察结果的分布区域。 下图有一个缺口,因为在分布的中间没有观察。
-
异常值 - 分布可以用与其他观测数据集大不相同的极值表征。 这些极端值被称为异常值。 下图说明了具有异常值的分布。
以上内容是否对您有帮助:
更多建议: