Normal dağılım, rastgele bir değişkenin değerini ideal bir duruma tatmin edici bir şekilde yaklaştırabilen teorik bir modeldir.
Başka bir deyişle, normal dağılım, ortalamaya ve standart sapmaya bağlı olan bir fonksiyona rastgele bir değişken sığdırır. Yani fonksiyon ve rasgele değişken aynı temsile sahip olacak, ancak küçük farklılıklar olacaktır.
Sürekli bir rastgele değişken herhangi bir gerçek sayı alabilir. Örneğin, hisse senedi getirileri, test sonuçları, IQ ve standart hatalar sürekli rastgele değişkenlerdir.
Ayrık bir rastgele değişken, doğal değerler alır. Örneğin, bir üniversitedeki öğrenci sayısı.
Normal dağılım Student's t dağılımı, ki-kare dağılımı, Fisher's F dağılımı ve diğer dağılımlar gibi diğer dağılımların temelidir.
Normal dağılım formülü
Rastgele bir X değişkeni verildiğinde, gözlemlerinin frekansının tatmin edici bir şekilde normal bir dağılıma şu şekilde yaklaşılabileceğini söylüyoruz:
Dağılım parametrelerinin ortalama veya merkezi değer ve standart sapma olduğu durumlarda:
Başka bir deyişle, X rastgele değişkeninin frekansının normal bir dağılımla temsil edilebileceğini söylüyoruz.
temsil
Normal bir dağılım izleyen rastgele bir değişkenin olasılık yoğunluk fonksiyonu.
Özellikleri
- Simetrik bir dağılımdır. Ortalama, medyan ve modun değeri çakışır. Matematiksel olarak,
Ortalama = Medyan = Mod
- Tek modlu dağıtım. Daha sık görülen veya ortaya çıkma olasılığı daha yüksek olan değerler ortalama civarındadır. Yani ortalamadan uzaklaştığımızda değerlerin ortaya çıkma olasılığı ve sıklığı azalmaktadır.
Normal bir dağılımı temsil etmek için neye ihtiyacımız var?
- Rastgele bir değişken.
- Ortalamayı hesaplayın.
- Standart sapmayı hesaplayın.
- Temsil etmek istediğimiz fonksiyona karar verin: olasılık yoğunluk fonksiyonu veya dağılım fonksiyonu.
teorik örnek
Bir testin sonuçlarının normal bir dağılıma tatmin edici bir şekilde yaklaşıp yaklaşamayacağını bilmek istediğimizi varsayıyoruz.
Bu teste 476 öğrencinin katıldığını ve sonuçların 0 ile 10 arasında değişebileceğini biliyoruz. Gözlemlerden (test sonuçları) ortalama ve standart sapmayı hesaplıyoruz.
Bu nedenle, rastgele değişken X'i, her bir sonuca bağlı olan test puanları olarak tanımlarız. Matematiksel olarak,
Her öğrencinin puanı bir tabloya kaydedilir. Bu şekilde, sonuçların ve sıklıklarının küresel bir vizyonunu elde edeceğiz.
Sonuçlar | Sıklık |
0 | 20 |
1 | 31 |
2 | 44 |
3 | 56 |
4 | 64 |
5 | 66 |
6 | 62 |
7 | 51 |
8 | 39 |
9 | 26 |
10 | 16 |
TOPLAM | 476 |
Tablo yapıldıktan sonra, muayene sonuçlarını ve frekansları temsil ediyoruz. Grafik önceki görüntüye benziyorsa ve özellikleri karşılıyorsa, test sonuçları değişkeni ortalama 4.8 normal dağılıma ve 3.09 standart sapmaya tatmin edici bir şekilde yaklaşılabilir.
Test sonuçları normal bir dağılıma yaklaşabilir mi?
Test sonuçları değişkeninin normal bir dağılım izlediğini düşünmenin nedenleri:
- Simetrik dağılım. Yani, merkezi değerin hem sağında hem de solunda aynı sayıda gözlem vardır. Ayrıca, ortalama, medyan ve mod aynı değere sahiptir.
Ortalama = Medyan = Mod = 5
- En sıklık veya olasılığa sahip gözlemler, merkezi değer civarındadır. Başka bir deyişle, daha az sıklık veya olasılıklı gözlemler, merkezi değerden uzaktır.
Normal dağılım, rastgele değişkeni standart hatalar (her sütunun üzerindeki çubuklar) üreten bir yaklaşımla tanımlar. Bu hatalar, gerçek gözlemler (sonuçlar) ile yoğunluk fonksiyonu (normal dağılım) arasındaki farktır.