统计数据 - 数据模式

2018-12-28 10:08 更新

当它们以图形方式绘制时,数据模式是非常有用的。 数据模式通常根据特征,如中心,展布,形状和其他不寻常的属性来描述。 其他特殊描述性标签是对称的,钟形的,歪斜的等。

中央

图形地,分布的中心位于分布的中值。 这样的图表显示,几乎一半的观察在任一侧。 每列的高度表示观察的频率。

Center Data Pattern

传播

分布的扩展是指数据的变化。 如果观测集合覆盖范围较宽,则扩展较大。 如果观察值集中在单个值周围,则扩展更小。

Spread Data Pattern

形状

可以使用以下特性描述分布的形状。

  • 对称 - 在对称分布中,图形可以在中心处分开,使得每一半都是另一半的镜像。

    Symmetry
  • 峰数。 - 具有一个或多个峰的分布。 具有一个清晰峰的分布被称为单峰,具有两个清楚峰的分布被称为双峰。 在中心处的单个峰对称分布被称为钟形。

    Number of peaks
  • 偏斜 - 某些分布在图形的一侧可能有多个观察结果。 对较低值的观察值较少的分布被称为偏斜; 而对较低值的观察值较少的分布被称为左偏。

    Skewness
  • 统一 - 当观察集合没有峰值并且数据在分布范围内均匀分布时,则该分布称为均匀分布。

    Uniform

不寻常的特点

数据模式的常见异常特征是缺口和异常值。

  • 间隙 - 间隙指向没有观察结果的分布区域。 下图有一个缺口,因为在分布的中间没有观察。

    Gaps
  • 异常值 - 分布可以用与其他观测数据集大不相同的极值表征。 这些极端值被称为异常值。 下图说明了具有异常值的分布。

    Outliers

以上内容是否对您有帮助:
在线笔记
App下载
App下载

扫描二维码

下载编程狮App

公众号
微信公众号

编程狮公众号