P-değeri - Nedir, tanımı ve konsepti

İçindekiler:

Anonim

İngilizce'den p-değeri, p değeri, bir dağılım fonksiyonu ve bir test istatistiği verilen sıfır hipotezini (H0) reddedebileceğimiz minimum keyfi olmayan anlamlılık seviyesidir.

Başka bir deyişle, p-değeri, sıfır hipotezini (H0) tanımlamak zorunda kalmadan reddedebileceğimiz dağılım tarafından tanımlanan minimum olasılıktır. Önsel kontrast için önem düzeyi.

Hatırlarsanız, dağılım fonksiyonunun eğrisinin altında kalan alanın bir olasılık olduğunu hatırlayacaksınız. Dolayısıyla, bu bakış açısından, p değeri, sıfır hipotezinin doğru olması için böyle aşırı bir test istatistiği gözlemleme olasılığı olacaktır.

Alan adı

p değeri bir olasılık olduğu için bu değer 0 ile 1 arasında olacaktır.

keyfi değil

%1, %5 ve %10 gibi görmeye daha çok alıştığımız anlamlılık düzeylerinden farklı olarak, p değeri, test istatistiğinin sahip olduğu dağılım fonksiyonuna bağlıdır. Böylece kontrastın başında %1, %5 ve %10 seviyelerine karar verilir. Bu seçime keyfi denir.

P-değeri formülü

p değeri, kritik değer gibi tek bir değer değildir, ancak istatistiğe bağlı olacaktır. Test istatistiğinin farklı değerleri için kritik değer aynı olacaktır. Öte yandan, test istatistiğinin farklı değerleri için p değeri de farklı olacaktır, çünkü p değeri, test istatistiğinin aldığı değere bağlıdır.

Nerede,

  • D, belirli bir dağılımı izleyen rastgele bir değişkendir.
  • d, test istatistiğinin değeridir.

Hesaplama

P-değerini elle hesaplamak mümkündür, ancak p-değeri küçük olma eğiliminde olduğu için çok sayıda ondalık sayı içeren çok kesin dağılım tablolarına sahip olmanız gerekir. Çoğu istatistiksel program, p-değerini zaten dahil etmiştir ve normal olarak, Sıradan En Küçük Kareler (OLS) tarafından yapılan tahmin sonuçlarının çıktısında görünür. Kullanımı zor görünebilir ancak pratikle çok kullanışlı bir araçtır.

P değerini hesaplamak için ihtiyacımız olan:

  • Kontrast istatistiği.
  • Kontrast istatistiğinin dağılımı ve parametrelerinin bilinmesi.

reddetme kuralı

p-değeri ise < anlamlılık düzeyi => H0 reddi.

p-değeri ise > anlamlılık düzeyi => Reddetme yok H0.

temsil

2 serbestlik dereceli ve kontrast istatistiği 3'e eşit olan bir Student t dağılımı durumunda, sıfır hipotezi (H0) doğru olduğunda böyle aşırı bir istatistiği bulma olasılığı %4.77'dir.

Başka bir deyişle, sıfır hipotezi (H0) doğru olsaydı, 3 kadar büyük bir istatistik zamanın yalnızca %4.77'sinde gözlemlenirdi.

Neden p-değeri deniyor?

p-değerinin adı, güven aralığı dışında dağılım fonksiyonunun eğrisinin altında kalan alan anlamına gelen tanımdan gelmektedir. O zaman, bu alan sıfır hipotezini reddetmenin minimum olasılığı olduğundan, p-değerinin "p"si, olasılık. Ve p değeri bir sayıya ve dolayısıyla bir değere karşılık geldiğinden, p değerinin "değeri" kelimesi sayısal şekle atfedilir. Bazı kitaplarda p değerine atıfta bulunan "olasılık değeri" bulabiliriz. Belki de "sıfır hipotezini reddetmek için minimum olasılık" demek çok uzundu ve öğrenciler için herhangi bir gizem tutmadı …