Kendall's Tau (II) - Nedir, tanımı ve konsepti

İki değişkenin uyumlu ve uyumsuz çiftlerini tanımlayan parametrik olmayan bir bağımlılık ölçüsüdür. Belirlendikten sonra toplamlar hesaplanır ve bölüm yapılır.

Başka bir deyişle, her bir değişkenin gözlemlerine bir sıralama atarız ve verilen iki değişken arasındaki bağımlılık ilişkisini inceleriz.

Kendall'ın Tau'sunu hesaplamanın iki yolu vardır; her bir değişkenin gözlemleri sıralandıktan sonra bağımlılık ilişkisini hesaplamayı seçiyoruz. Örneğimizde X sütunundaki sıralamaları artan düzende sıraladığımızı göreceğiz.

Pearson korelasyon katsayısını uygulayamadığımızda, iki değişken arasındaki bağımlılığın bir ölçüsü olarak sınıflandırılmış korelasyonlar parametrik olmayan bir alternatiftir.

Bunlar, ilk makale -> Kendall's Tau (I)'da atıfta bulunduğumuz sonuçlardır:

Kayak Merkezi (ben) X Z C Kuzey Kore
KİME 1 1 6 0
B 2 3 5 0
C 3 4 5 1
D 4 2 4 0
VE 5 7 4 1
F 6 6 4 1
G 7 5 43 3 TOPLAM
  • BC-CB çifti uyumsuz bir çifttir. NC sütununa 1 giriyoruz ve tekrar eşleşen bir çift bulana kadar sayacı son konumda donduruyoruz. Bu durumda eşleşen çift sayısını 5'te D istasyonuna kadar dondurduk. İstasyon D sadece 4 eşleşen çift oluşturabilir: AD-DA, DE-ED, DF-FD, DG-GD.

Bir başka uyumsuz çift EF-FE olacaktır:

  • EF-FE çifti uyumsuz bir çifttir. NC sütununa 1 yazıp oluşturulabilecek uyumlu çiftlerin 4 sayısını sürüklemeye devam ediyoruz. E istasyonunun eşleşen çiftleri şöyle olacaktır: EA-AE, EB-BE, EC-CE, ED-DE çünkü EF-FE uyumsuzdur.
    • FG-GF çifti uyumsuz bir çifttir. NC sütununa 1 yazıp oluşturulabilecek uyumlu çiftlerin 4 sayısını sürüklemeye devam ediyoruz. F s istasyonunun uyumlu çiftleri (4 yerine değiştirmedik) Daha önce gösterebileceğimiz uyumlu çiftler (değiştirmedik: FA-AF, FB-BF, FC-CF, FD-DF çünkü FG-GF sarsıcı.

Kendall'ın Tau'sunu hesaplıyoruz

Kendall'ın Tau'sunun, bir gözlem örneğinin uyumlu ve uyumsuz çiftlerinin bölümü olmanın ötesinde bir sırrı yoktur.

yorum

İlk sorumuz şuydu: Verilen kayak merkezlerinde yokuş aşağı kayakçıların tercihleri ​​ile Kuzeyli kayakçıların tercihleri ​​arasında bir bağımlılık ilişkisi var mı?

Bu durumda, 0.8695'lik iki değişken arasında bir bağımlılığımız var. Üst sınıra çok yakın bir sonuç. Bu sonuç bize alp disiplini kayakçılarının (X) ve Kuzeyli kayakçıların (Z) tatil yerlerini benzer sınıflandırmalara göre sınıflandırdığını göstermektedir.

Herhangi bir hesaplama yapmaya gerek kalmadan ilk istasyonların (A, B, C) iki gruptan en iyi puanları aldığını görebiliriz. Başka bir deyişle, kayakçıların reytingleri aynı yönde ilerliyor.

Karşılaştırma: Pearson vs Kendall

Pearson korelasyon katsayısını önceki gözlemlere göre hesaplar ve Kendall'ın Tau'su ile karşılaştırırsak, şunu elde ederiz:

Bu durumda Kendall'ın Tau'su bize X ve Z değişkenleri arasında Pearson'ın korelasyon katsayısına kıyasla daha güçlü bir bağımlılık ilişkisi olduğunu söyler: 0.8695> 0.75.

Aykırı değerlerin sonuçlar üzerinde çok fazla etkisi olsaydı, Pearson ve Spearman arasında büyük bir fark bulurduk ve bu nedenle Spearman'ı bir bağımlılık ölçüsü olarak kullanmalıyız.