Student's t dağılımı - Nedir, tanımı ve kavramı

Student's t dağılımı veya t dağılımı, örneklem boyutu küçük olduğunda ve standart sapma bilinmediğinde, normal olarak dağılmış bir popülasyonun birinci dereceden momentini yaklaşık olarak tahmin etmek için kullanılan teorik bir modeldir.

Başka bir deyişle, t-dağılımı, normal bir dağılım izleyen ve standart sapmasını bilmediğimiz bir popülasyondan alınan küçük bir örneğin ortalamasının değerini tahmin eden bir olasılık dağılımıdır.

Önerilen makaleler: serbestlik dereceleri, serbestlik dereceleri (örnek) ve normal dağılım.

Öğrencinin t-dağılım formülü

Sürekli bir rasgele değişken L verildiğinde, gözlemlerinin frekansının g serbestlik dereceli bir t dağılımına tatmin edici bir şekilde yaklaşılabileceğini söylüyoruz, öyle ki:

Öğrencinin t dağılımının gösterimi

3 serbestlik dereceli (df) bir t dağılımının yoğunluk fonksiyonu.

Gördüğümüz gibi, t-dağılımının temsili, normal dağılımın daha geniş kuyruklara sahip olması ve daha fazla payanda olması dışında normal dağılıma çok benziyor. Diğer bir deyişle, dağılımın “büyümesi” ve normal dağılıma daha çok benzemesi için t-dağılımine daha fazla serbestlik derecesi eklemeliyiz.

uzmanlık

Ve… t-dağılımı neden bu kadar özel?

Çünkü ortalamaya ve varyansa bağlı olan normal dağılımın aksine, t dağılımı sadece İngilizce'den serbestlik derecelerine bağlıdır, özgürlük derecesi (df). Başka bir deyişle, serbestlik derecelerini kontrol ederek dağılımı kontrol ederiz.

Öğrencinin t uygulaması

t dağılımı şu durumlarda kullanılır:

  • Küçük bir örneklemden normal olarak dağılmış bir popülasyonun ortalamasını tahmin etmek istiyoruz.
  • Örnek boyutu 30 öğeden az, yani n <30.

30 gözlemden, t-dağılımı normal dağılıma çok benziyor, bu yüzden normal dağılımı kullanacağız.

  • Bir popülasyonun standart sapması bilinmemektedir ve örneğin gözlemlerinden tahmin edilmesi gerekir.

Misal

27 serbestlik dereceli (df) bir Student t dağılımını izleyen bir G rastgele değişkenine ilişkin 28 gözlemimiz olduğunu varsayıyoruz.

Matematiksel olarak,

Gerçek verilerle çalıştığımız için veriler ve dağılım arasında her zaman bir yaklaşım hatası olacaktır. Başka bir deyişle, ortalama, medyan ve mod her zaman sıfır (0) veya tam olarak aynı olmayacaktır.

Bir histogram aracılığıyla G değişkeninin her bir gözleminin sıklığını temsil ediyoruz.

Rastgele değişken G bir t dağılımına yaklaşabilir mi?

G değişkeninin bir t dağılımını takip ettiğini düşünmek için nedenler:

  • Dağılım simetriktir. Yani, merkezi değerin hem sağında hem de solunda aynı sayıda gözlem vardır. Ayrıca, ortalama ve medyan aynı değere yakın olma eğilimindedir. Ortalama yaklaşık olarak sıfırdır, ortalama = 0.016.
  • En sıklık veya olasılığa sahip gözlemler, merkezi değer civarındadır. Daha az sıklığa veya olasılığa sahip gözlemler, merkezi değerden uzaktır.