Çeyrek sapma - Nedir, tanımı ve kavramı

İçindekiler:

Anonim

Çeyrek sapma, çeyrekler arası aralığın merkezi değerini döndüren ve çarpık veri kümelerinde kullanılan istatistiksel bir dağılım ölçüsüdür.

Diğer bir deyişle, çeyrek sapma, çeyrekler arası aralığın (IQR) medyanını hesaplamak içindir ve oldukça uç değerler içeren veri setlerinde kullanılır.

Çeyrek sapmanın kısaltması DQ'dur.

Çeyrekler arası aralık

Çeyrekler arası aralık, genellikle kutu grafiğinde kullanılan bir veri kümesinin dağılımının bir ölçüsüdür. Başka bir deyişle, çeyrekler arası aralık, kutu grafiğinde kullanılan bir dağılımın sondan bir önceki ve ilk çeyrekleri arasındaki farktır.

IQR = Q3 - Q1

Çeyrekler arası aralığı kullanmanın avantajı, önyargılı veri kümelerimiz olduğunda çok yeterli bir dağılım ölçüsü olan çeyrek sapmanın (DQ) hesaplanabilmesidir.

Çeyrek sapma formülü

Çeyrek sapma, çeyrekler arası aralığın 2'ye bölümü olarak hesaplanır.

DQ = (Q3 - Q1) / 2 = RIC / 2

Yalnızca üçüncü ve birinci çeyrekler arasındaki dağılımı dikkate aldığımızdan, bu aralığın dışındaki tüm verileri yok sayarız. Ve bu nedenle tüm değerler aşırı olmaya yakın. Yani, çeyrekler arası aralığı ikiye bölersek, dağılımın medyan değerini elde ederiz.

Çeyrek sapma örneği

Yıl boyunca evimizin önünden geçen bisikletçi sayısının çeyrekler arası aralığını ve çeyrek sapmasını hesaplamak istediğimizi varsayalım.

  1. Önce bisikletlileri sayıyoruz ve bilgileri bir tabloda topluyoruz.
  1. İkinci olarak, çeyrekler arası aralığı elde etmek için birinci ve üçüncü çeyrekleri hesaplıyoruz.

Q3 = 550

Q1 = 200

IQR = Q3 - Q1 = 550 - 200 = 350

  1. Üçüncüsü, çeyrekler arası aralığı ikiye bölerek çeyrek dağılımını hesaplıyoruz.

DQ = (Q3 - Q1) / 2 = IQR / 2 = 350/2 = 175

Bu veri seti için çeyrek yayılım 175'tir. Bu sayı, çeyrekler arası aralığın merkezi değeridir.

Temmuz ayı verilerinin diğer tüm verilerden birkaç kat daha fazla olması nedeniyle ekstrem veriler olduğunu belirtmekte fayda var. Dolayısıyla bu veri setinin o aya yönelik önyargılı olduğunu söyleyebiliriz. Aşırı verilere doğru çeyrek dağılımının “cehaleti” sayesinde, bu önlemin sonucu Temmuz ayında sadece 600 bisikletçinin dolaşmasına çok benzer. Temmuz ayında sadece 600 bisikletçi olsaydı, o ayki bisikletçi sayısının 10 kat daha az olduğu düşünülürse, çeyrek dağılım 162,5, 175'e çok yakın olurdu.