Veri Madenciliği - Nedir, tanımı ve konsepti

İçindekiler:

Veri Madenciliği - Nedir, tanımı ve konsepti
Veri Madenciliği - Nedir, tanımı ve konsepti
Anonim

Veri madenciliği, karar vermede kullanılabilecek faydalı bilgileri bulmak için büyük veri tabanlarını araştırma sürecidir.. İngilizce "veri madenciliği" terimi de kullanılmaktadır.

Veritabanındaki davranış kalıplarını bulmak için kullanılan teknoloji ve yazılım olarak anlaşılabilir. Bunun temel temeli, bu kalıpların karar vermeye yardımcı olmasıdır. Örneğin, şirketlerin müşterilerinin davranış kalıplarını anlamalarına yardımcı olabilir. Satışları artırmaya veya maliyetleri düşürmeye yönelik stratejilerin oluşturulmasını kolaylaştıracak şekilde.

Veri madenciliğinin avantajları

Bu veri analizi sürecinin temel avantajı, uygulanabileceği çok sayıda iş senaryosudur, örnek olarak elimizde:

  • tahmin: Şirketin satışlarının tahmini.
  • olasılık: Telefon veya e-posta yoluyla doğrudan iletişim için en iyi müşterilerin seçimi.
  • dizi analizi: Müşterilerin satın aldığı ürünlerin analizi ve aralarındaki ilişkinin kontrol edilmesi.

Veri madenciliğinin aşamaları

Bir veri madenciliği sürecinde beş aşama bulabiliriz:

  • Amaç ve veri toplama: Öncelikle ne tür bilgi elde etmek istediğimize odaklanıyoruz. Bir süpermarketin en çok müşteri katılımının olduğu günün hangi saatinde olduğunu bilmek istediği örneğini düşünelim. Bu, bu durumda ticaretin elde etmek istediği amaç ve bilgi olacaktır.
  • Veri işleme ve yönetimi: Toplamak istediğimiz verileri öğrendikten sonra, verileri işe koyarız. Bu belki de sürecin en zor aşamasıdır. Eh, analizin gerçekleştirileceği temsili numunenin seçilmesini gerektirir. Örneklem seçildikten sonra, örneklem üzerinde ne tür değişkenler veya regresyon modeli uygulanacağı analiz edilmelidir.
  • Model seçimi: Bir önceki aşama ile yakından ilişkilidir. Bize mümkün olan en iyi sonucu veren bir model veya algoritma oluşturmakla ilgilidir. Bunu yapmak için, modele dahil edilecek değişkenlerin kapsamlı bir analizi yapılmalıdır. Bu, analiz edilecek bilginin türüne bağlı olacağından karmaşık bir görev haline gelir. Bu nedenle, veri madencileri algoritmanın doğrusal regresyon, karar ağacı, zaman serisi, sinir ağı vb. gibi farklı testlerini gerçekleştirir.
  • Sonuçların analizi ve gözden geçirilmesi: Temel olarak, mantıklı bir açıklama verip vermediklerini görmek için sonuçları analiz etmektir. Sonuçların sağladığı bilgilere dayanarak karar vermeyi kolaylaştıran açıklama.
  • Model güncellemesi: Sürecin son adımı modelin güncellenmesi olacaktır. Eskimemesi için zamanla yapılması çok önemlidir. Modelin değişkenleri önemsiz hale gelebilir ve bu nedenle modelin periyodik olarak kontrol edilmesi gerekir.