Excel Ortamında Veri Temizleme

Veri analizi sürecinde, ham verilerin temizlenmesi ve düzenlenmesi, kritik bir adımdır. Verilerin tutarlı ve analize uygun hale getirilmesi büyük önem taşır. Bu yazıda, daha önceki blogda indirdiğimiz emlak veri setini temizleyeceğiz. Excel ortamında veri temizleme işlemminin nasıl yapıldığını adım adım anlatacağız. Veri setinin nasıl elde edildiğini öğrenmek isterseniz buraya tıklayabilirsiniz.

Excel, birçok kişinin aşina olduğu ve yaygın olarak kullanılan bir programdır. Bu sebeple, bu projede temizleme işlemlerini Excel üzerinden gerçekleştireceğiz.

Excel Ortamında Veri Temizleme Projesinde Kullandığımız Veri Seti

Önceki blog yzımızda konut verilerinin nasıl kazınabileceğini işledik. Web scrabing ile elde ettiğimiz bu veri setini aşağıdaki linkten indirebilirsiniz.

Ayrıca çalışmanın tüm veri setlerini ve kodlarını GitHub repomuzdan indirebilirsiniz.

Başlangıç Verilerinin Değerlendirilmesi

Ham verilerimiz şu sütunlardan oluşuyor:

  • İlan başlığı (Title)
  • Fiyat (Price)
  • Konum (Location)
  • Metrekare (Size)
  • Oda sayısı (Room)
  • Bina yaşı (Age)
  • Kat bilgisi (Floor)

Aşağıda emlak veri setimizin ekran görüntüsü görülmektedir.

Temel Veri Temizleme Adımları

A) Fiyat(Price) Sütunu Düzenleme

  • Burada hemen hemen tüm işlemleri ”Bul ve Değiştir” penceresi yardımıyla yapacağız. Windows’da CTRL+H ile açılıyor.
  • Aranan’a nokta “.” Yazıp yeni değer kısmını aşağıdaki resimdeki gibi boş bırakacağız. Bu işlemle beraber fiyattaki tüm noktalar temizlenmiş olacak.
  • Örnek: “1.200.000 TRY” → 1200000
Excel Ortamında Veri Temizleme

B) Konum Verisi Düzenleme

  • Önce İstanbul bilgisini temizleyelim. Bul ve Değiştir penceresini açacağız: Aranan kısma “İstanbul / “ yazacağız Yeni değerde aşağıdaki gibi boş kalacak. Tümünü Değiştir diyeceğiz.
Excel Ortamında Veri Temizleme

  • Daha sonra Metni sütuna çevirme sihirbazına tıklayıp Adım 2 de Ayırıcılar kısmına aşağıdaki resimde olduğu gibi “/” yazıp “son” butonuna tıkladığımızda ilçe ile mahalleleri ayıracak. 
Excel Ortamında Veri Temizleme

C) Metrekare Bilgisi Düzenleme

  • “m²” ifadesinin kaldırılması için yine aynı işleme başvuruyoruz. Bul ve Değiştir kısmı ile m2 kısımı siliyoruz.
  • Örnek: “80 m²” → 80

D) Oda Sayısı Standardizasyonu

  • Odaları tek tek değiştireceğiz. 1+0 dan başlayarak nereye kadar giderse bakacağız.
  • Bul ve Değiştir’i açıp mesela 2+1 i 3 olarak değiştirmesini isteyeceğiz
  • Örnek: “2 + 1” → “3”

E) Bina Yaşı Temizleme

  • “at Age” ifadesinin kaldırılmasıda yine aynı şekilde Bul ve Değiştir kısmı ile kaldırılacak.
  • Örnek: “26 at Age” → 26

F) Kat Bilgisi Standardizasyonu

  • “Floor” ifadesinin kaldırılması
  • Kat numaralarının standart formata getirilmesi
  • Örnek: “Garden Floor” → “0”, “2. Floor” → “2”

Son Kontroller

Bu temizleme işlemleri sonucunda, veri setimiz analiz için hazır hale gelecektir. Temiz veri, daha doğru analizler yapılmasını ve güvenilir sonuçlar elde edilmesini sağlar. Ayrıca, bu aşamada oluşturulan veri seti, makine öğrenmesi modellerinin eğitimi için de uygun format kazanmış olur.

Sonuç:

Bu adımları izleyerek emlak veri setinizi düzenleyebilir ve analiz için uygun hale getirebilirsiniz. Veri temizleme, analiz sürecinin en kritik aşamalarından biridir. Bu süreç ile birlikte, veriler makine öğrenmesi için hazır hale gelmiş olur.

Eğer veri temizleme, analiz veya yapay zeka destekli çözümler hakkında destek almak için tıklayınız.

DeepMineAI olarak her zaman yanınızdayız. Verinin gücünü kullanarak birlikte yeni fırsatlar keşfedelim!

Excel Ortamında Veri Temizleme Konusunda Sıkça Sorulan Sorular

Yorum bırakın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir