Kümeleme analizi - Nedir, tanımı ve konsepti

Küme analizi, bir dizi durumu veya bireyleri kümeler veya kümeler halinde gruplandırmayı amaçlayan bir dizi çok değişkenli istatistiksel tekniktir.

Kümeleme analizi, bu nedenle, bir tür istatistiksel gruplamadır. Amaç, her kümedeki verileri mümkün olduğunca birbirine benzer ve diğer gruplara göre mümkün olduğunca farklı hale getirmektir. Değişkenlerle de yapılabilir.

Küme analizinde veri dönüşümü

Verileri grupladığımızda karşılaştığımız sorunlardan biri, verilerin bazen farklı ölçü birimlerinde olmasıdır. Bu nedenle kümelemeye izin veren bir kümeleme öncesi analiz adımı gerçekleştirilmelidir.

En yaygın yöntem standardizasyondur. Bu, verileri benzer ölçü birimlerine sahip olacak şekilde dönüştürmek için kullanılır. İki kural dikkate alınmalıdır, ikili değişkenler standart değildir ve kategorik iseler ikili hale gelirler (varlık / yokluk).

Küme analizindeki yöntemler

Küme analizini gerçekleştirmek için birçok yöntem vardır, ancak bizi karakterize eden basitlik ilkesini takip ederek Economy-Wiki.com'da şematik bir şekilde en alakalı olanı göreceğiz.

hiyerarşik yöntemler

İlk sınıflandırma hiyerarşik veya hiyerarşik olmayan yöntemler olacaktır. Eski grup bireyleri hiyerarşik aşamalara (dolayısıyla isimleri) ayırır. Bu şekilde, bir seferde yalnızca bir nesne grubu değiştirir, geri kalanı aynı yerde kalır.

Bunlar sırayla sınıflandırılır:

aglomeratif yöntemler

Bireylerin her seferinde daha az kümede gruplandırılmasından oluşur. Vaka sayısına eşit sayıda gruptan başlıyor ve azalıyor.

En iyi bilinenler şunlardır:

  • En yakın komşu yöntemi: Bu durumda, verileri gruplamak için bir algoritma kullanırsınız. Aradığınız şey, en yakın bireyler arasındaki minimum mesafedir. "Gürültüye" neden olabilecek verilere karşı çok hassastır. En uzak komşu yöntemi benzerdir.
  • Gruplar arası ortalama yöntem: Yaptığı şey, bir gruptaki bireyler ile özellikle bunlardan biri arasındaki mesafenin ortalamasını hesaplamaktır. Sözde "gürültüyü" azaltmak çok yararlıdır.
  • Ward'ın yöntemi: Yaptığı şey, bilgi kaybını önlemek için her bir birey ile kümesinin ortalaması arasındaki sapmaların karelerini eklemektir. En iyi bilinenlerden biridir ve ortalamaya dayalı yöntemin avantajlarına sahiptir, ancak daha fazla ayırt etme gücüne sahiptir.

Dissosiyatif yöntemler

Bu durumda yaptığınız şey bölmektir. Tek bir küme ile başlar ve bir dizi gereksinime dayalı olarak bölümler önerilir.

En yaygın olanları:

  • Gruplar arası ortalama, en yakın komşu ve en uzak komşu yöntemi: Bu üç yöntem önceki duruma benzer, ancak dissosiyatif yöntemi kullanıyor. Yani bu sefer yaptığımız şey grup değil ayrı.
  • merkez yöntemi: Tesis yeri optimizasyon problemlerinde yaygın olarak kullanılmaktadır. En uygun olanları bulmak için bu tür analizleri kullanın.

hiyerarşik olmayan yöntemler

Bu durumda önceden ayarlanmış bir çözümle başlarlar. Bu, küme analizi için başlangıç ​​noktasıdır. Bu şekilde gruplar önceden kurulur ve her vaka özelliklerine göre bunlardan birine yerleştirilir. Sırayla, onları diğer alt gruplara ayırabiliriz.

  • Yeniden atama yöntemleri: En alakalı olanları, k-ortalamalar gibi centroid yöntemleridir. PAM gibi medioidlerinkiler. Veya dinamik bulutlarınki.
  • Doğrudan yöntemler: En önemlisi veri madenciliğinde yaygın olarak kullanılan blok kümelemedir.
  • indirgeyici yöntemler: Bunlar faktör analizine dayanmaktadır.
  • Yoğunluk arama yöntemleri: Bir yanda modal analiz gibi tipolojik yaklaşımlar olacaktır. Öte yandan, Wolf'unki gibi olasılıksal olanlara sahibiz.

Küme Analizi Örnekleri

Son olarak, küme analizi uygulamalarının bazı örneklerini görelim.

  • Enflasyon veya işsizlik gibi belirli makroekonomik değişkenlere göre gruplandırmak istediğimiz bir ülke grubumuz olduğunu düşünelim. Bu tür analizleri, örneğin az ya da çok gelişmiş ülkeler gibi homojen gruplar oluşturmak için kullanabiliriz.
  • Başka bir örnek, belirli sosyodemografik özelliklere sahip bir dizi tüketici olabilir. Buradaki fikir, benzer bireylerden oluşan ve sırayla birbirinden çok farklı olan gruplar oluşturmaktır.
  • Ancak ekonomiye ek olarak, küme analizi diğer bilimlerde de faydalıdır. Örneğin biyolojide, türleri sınıflandırmak veya jeolojide aynı şeyi minerallerle yapmak.

Arkadaşlarınızla sayfasını paylaşan sitenin gelişimine yardımcı olacak

wave wave wave wave wave