Tanımlayıcı istatistik, veri seti üzerindeki temel parametreleri toplamak, depolamak, sıralamak, tablo veya grafik yapmak ve temel parametreleri hesaplamaktan sorumlu bir disiplindir.
Tanımlayıcı istatistikler, istatistiksel çıkarım veya çıkarımsal istatistiklerle birlikte, iki büyük istatistiğin dalından biridir. Kendi adı onu gösterir, bir şeyi tarif etmeye çalışır. Ancak bunu hiçbir şekilde tanımlamayın, nicel bir şekilde. Bir kutu sebzenin ağırlığını, bir kişinin boyunu veya bir işletmenin kazandığı para miktarını düşünün. Bu değişkenler hakkında çok şey söyleyebiliriz. Örneğin, şu veya bu domates kutusunun diğerlerinden daha ağır veya daha hafif olduğunu belirtebiliriz. Başka bir örnekle devam edersek, bir şirketin gelirinin zaman içinde çok değiştiğini veya bir kişinin ortalama bir boyda olduğunu söyleyebiliriz.
Yukarıdaki ifadeleri, çok, az, yüksek, düşük, çok değişken veya az değişken hakkında dikte etmek için ölçüm değişkenlerine ihtiyacımız var. Yani, onları nicelleştirmemiz, bir sayı sunmamız gerekiyor. Bunu akılda tutarak, düşündüğümüz kadar domates kutusunun ağırlığını bulmak için ölçü birimi olarak gram veya kilogram kullanabiliriz. Otuz kutuyu tarttığımızda, hangilerinin daha ağır olduğunu, hangilerinin daha az olduğunu, en çok ne kadar tekrarlandığını veya farklı kutuların ağırlıkları arasında çok fazla eşitsizlik olup olmadığını bileceğiz.
Tanımlayıcı istatistikler, veri toplamak, depolamak, belirli bir konuda bize bilgi sunan tablolar ve hatta grafikler oluşturmak için bu fikirle doğdu. Ek olarak, bize büyük miktarda verinin bilgilerini özetleyen önlemler sunarlar.
İstatistiksel değişken türleri
Tanımlayıcı istatistikler içerisinde verileri nitel veya nicel olarak tanımlayabiliriz.
- Niteliksel değişken: Bir kaliteyi ifade eder. Örnekler: bir kişinin göz rengi veya saç rengi.
- Nicel değişken: Niceliksel bir ölçüyü ifade eder. Örnekler: bir kişinin santimetre cinsinden boyu veya kilogram cinsinden bir kişinin ağırlığı.
Böylece, bu değişkenler üzerinde belirli parametreler hesaplanabilir. Özellikle nicel değişkenler konusunda. Örneğin, göz renginin ortalama değeri nedir? Mavi göz rengine sahip beş kişi ve yeşil göz rengine sahip beş kişi varsa, ortalama mavi-yeşil göz rengine sahip olmaları olmayacaktır. Dolayısıyla bu durumda aşağıda göreceğimiz bazı parametreleri hesaplamamız mümkün olmayacaktır.
istatistiksel değişkenTemel istatistiksel parametreler
Bilgileri özetlemek için, belirli türde önlemler sunan çeşitli formüller geliştirildi. Bu nedenle, bize merkez hakkında bilgi verenler vardır, diğerleri dağılım veya değişkenlik hakkında ve diğerleri bir değerin konumu hakkında.
- Merkezi Eğilim Ölçüleri: Veri kümesi merkezi hakkında bilgi sağladıkları için bu şekilde adlandırılmıştır. Örneğin, ortalama bize veri kümesinin ortalanmış bir değerini verdiğinden, ortalama eğilim veya merkezi konumun bir ölçüsüdür. Orta noktanın nerede olduğunu söyleyebiliriz? Merkezde, yaklaşık olarak ortada. Merkezi eğilim ölçüsünün bir başka örneği medyandır.
- Dağılma ölçüleri: Değişkenlik ölçüleri olarak da bilinirler. Örneğin standart sapma, bir veri kümesinin değerlerinin çok farklı olup olmadığını bize söylediği için bir değişkenlik ölçüsüdür. Dağılım ölçülerine iki örnek daha varyans ve istatistiksel aralık olabilir.
- Konum ölçümleri: En iyi bilinenler değiller, ancak sıklıkla kullanılıyorlar. Bunun bir örneği yüzdelik dilimlerde veya yüzdelik dilimlerde bulunur. Belirli bir verinin yüzde 90'lık dilimde olması, verilerin %90'ının o verinin altında olduğu anlamına gelir. Çeyrekler gibi başka konum ölçüleri veya ilk çeyrek gibi bazı değişkenler vardır.
Frekans dağılımı
Frekansların nasıl dağıldığını görmek de ilginç. Bunun için bilmemiz gereken bazı kavramlar vardır:
- Mutlak frekans: Bir gözlemin toplam tekrarlanma sayısıdır. Gözlemler bazen aralıklarla sunulabilir.
- Göreceli frekans: Bir gözlemin veya bir dizi gözlemin tekrarlanma oranıdır.
- Birikmiş frekans: Birikmiş bağıl veya birikmiş mutlak olabilir. Belirli bir gözleme kadar biriken miktarı gösterir.
Tanımlayıcı istatistiklerde tablolar ve grafikler
Tablolar ve grafikler tanımlayıcı istatistiklere özgü olmasa da, onu karakterize ederler. Raporlarda, çalışmalarda ve araştırmalarda grafik kullanımı çok yaygındır. Bilgileri daha basit ve daha sınırlı bir şekilde göstermemize yardımcı olurlar.
Tabii ki, tablolar ve grafikler içinde çok sayıda tür vardır. İşte sık kullanılan grafik ve tablolardan bazı örnekler.
- histogram.
- çubuk grafik.
- Yuvarlak diyagram.
- Olasılık tabloları.
- İki boyutlu tablolar.
- Kutu grafiği.
Tanımlayıcı istatistik örnekleri
Bir futbolcunun maç başına ortalama gollerini hesaplamak istediğimizde tanımlayıcı istatistiklere bir örnek verilebilir. Bir değişkeni (hedef sayısı) tanımlamaya çalıştığımız için bu tanımlayıcı istatistiklerdir. Bu durumda, bir metrik hesaplayarak.
Yani Ronaldo'nun son 30 maçta maç başına 1,05 gol kaydettiğini söylemek, doğru bir tanımlayıcı istatistik ifadesidir.
Örneğin, Juan'ın sınıf arkadaşlarının %30'unun mavi, %60'ının kahverengi ve kalan %10'unun siyah olduğunu söyleyebiliriz. Niteliksel bir değişken (göz rengi) olurdu, ancak ortaya çıkma sıklığını tanımlıyoruz.