Belirleme katsayısı (R kare)

Belirleme katsayısı, regresyon tarafından açıklanan değişkenin toplam varyansının oranıdır. R kare olarak da adlandırılan belirleme katsayısı, bir modelin açıklamayı amaçladığı değişkene uygunluğunun iyiliğini yansıtır.

Belirleme katsayısının sonucunun 0 ile 1 arasında salınım yaptığını bilmek önemlidir. Değeri 1'e ne kadar yakınsa, modelin açıklamaya çalıştığımız değişkene uyumu o kadar büyük olur. Tersine, sıfıra ne kadar yakınsa, model o kadar az sıkı olacak ve dolayısıyla o kadar az güvenilir olacaktır.

Önceki ifadede bir kesirimiz var. O halde parça parça gidelim. İlk olarak, pay, yani üst kısmı analiz edeceğiz.

Varyans ifadesini bilmeyenler için bununla ilgili makaleyi okumanızı tavsiye ederim. Bunu bilenler için, bunun varyansın ifadesi olduğunu, ancak iki temel farkla olduğunu fark edebilirler.

İlk fark, Y'nin bir inceltme veya öğretmenlerin didaktik olarak “şapka” dediği şeye sahip olmasıdır. Bu şapka ayrıntısı, Y'nin, açıklayıcı değişkenlere göre Y değerinde olanın bir modelinin tahmini olduğu, ancak Y'nin gerçek değeri değil, Y'nin bir tahmini olduğudur.

İkinci olarak, T'ye bölmek gerekir. Diğer durumlarda, N veya gözlem sayısı olarak belirtilir. Ancak payda formülü de onu taşıyacağından, ifadeyi sadeleştirmek için paydaları (altta) her iki formülden de çıkarıyoruz. Bu şekilde onunla çalışmak daha kolaydır.

Daha sonra payda kısmı (alt kısım) ile aynı analizi yapacağız.

Bu durumda, orijinal varyans formülünden tek fark paydasının olmamasıdır. Yani, T veya N ile bölmeyiz. Bu şekilde, R karenin genel ifadesinin veya belirlenim katsayısının iki kısmı açıklandıktan sonra bir örnek göreceğiz.

varyasyon katsayısıDoğrusal korelasyon katsayısıRegresyon analizi

Belirleme katsayısının yorumlanması

Cristiano Ronaldo'nun attığı gollerin sayısını oynadığı maç sayısına göre açıklamak istediğimizi varsayalım. Ne kadar çok oyun oynarsa o kadar çok gol atacağını varsayıyoruz. Veriler son 8 sezona aittir. Böylece, verileri çıkardıktan sonra, model aşağıdaki tahmini verir:

Grafikten de görebileceğimiz gibi, ilişki pozitiftir. Elbette ne kadar çok maç oynarsa, sezonda o kadar çok gol atar. R-kare hesaplamasına dayalı uyum, 0.835'tir. Bu, tahminleri gerçek değişkene oldukça iyi uyan bir model olduğu anlamına gelir. Teknik olarak doğru olmasa da modelin reel değişkenin %83,5'ini açıkladığı şeklinde bir şey söyleyebiliriz.

Belirleme Katsayısı Problemi

Belirleme katsayısı sorunu ve düzeltilmiş belirleme katsayısının ortaya çıkmasının nedeni, anlamlı olmayan açıklayıcı değişkenlerin dahil edilmesini cezalandırmamasıdır. Yani modele Cristiano Ronaldo'nun bir sezonda attığı gollerle çok az ilişkisi olan beş açıklayıcı değişken eklenirse, R kare artacaktır. Bu nedenle birçok ekonometrik, istatistikçi ve matematik uzmanı, gerçek uyumun iyiliğinin temsili bir ölçüsü olarak R karenin kullanılmasına karşı çıkmaktadır.

Ayarlanmış kararlılık katsayısı

Düzeltilmiş belirleme katsayısı (düzeltilmiş R kare), açıklanan değişkenin varyansına göre regresyonun varyansı tarafından açıklanan yüzdeyi tanımlayan ölçüdür. Yani, R kare ile aynıdır, ancak bir fark vardır: Ayarlanmış belirlenim katsayısı, değişkenlerin dahil edilmesini cezalandırır.

Daha önce de söylediğimiz gibi, dahil ettiğimiz değişkenler ilgili olmasa bile bir modelin belirleme katsayısı artar. Bu bir problem olduğundan, çözmeye çalışmak için ayarlanmış R karesi şu şekildedir:

Formülde N, örneklem büyüklüğü ve k açıklayıcı değişkenlerin sayısıdır. Matematiksel kesinti ile, k'nin daha yüksek değerleri, ayarlanan R-kare, normal R-kareden daha uzak olacaktır. Tersine, daha düşük k değerlerinde, merkezi kesir 1'e ne kadar yakın olur ve bu nedenle, ayarlanmış R karesi ve normal R karesi daha benzer olacaktır.

k'nin açıklayıcı değişkenlerin sayısı olduğunu hatırlayarak, bunun sıfır olamayacağı sonucuna varırız. Sıfır olsaydı, model olmazdı. En azından, bir değişkeni başka bir değişken açısından açıklamamız gerekecek. k'nin en az 1 olması gerektiğinden, ayarlanmış R-kare ve normal R-kare aynı değere sahip olamaz. Ayrıca, ayarlanmış R-kare her zaman normal R-kareden daha küçük olacaktır.

Arkadaşlarınızla sayfasını paylaşan sitenin gelişimine yardımcı olacak

wave wave wave wave wave