Twitter Duygu Analizi Tahmini

Twitter Duygu Analizi Tahmini

Bu proje ile Twitter Duygu Analizi Tahmini porjesini gerçekleştirdik. Twitter’dan (şimdi X olarak biliniyor) alınan 1.6 milyon tweet verisini kullanarak duygu analizi tahmini yaptık. Bununla birlikte, zaman serisi modellemeleriyle kısa vadeli tahminler yaptık. Apache Spark ve Apache Hive kullanarak verileri işledik. Ayrıca, duygu skoru hesapladık. Hesaplanan duygu skorları, ARIMA ve LSTM modelleriyle zaman serisi analizine tabi tuttuk. Sonrasında, gelecekteki tweet duyguları tahmin ettik.

Twitter Duygu Analizi Tahmini Çalışmanın Adımları

  1. Veri Kaynağının Analizi:
    • 1.6 milyon tweet verisi, ‘ProjectTweets.csv’ dosyasından alınmıştır ve MySQL veritabanına aktarılmıştır.
    • Özel karakterleri temizledik. Bununla birlikte verileri Apache Spark ve Apache Hive kullanarak işledik.
  2. Duygu Analizi:
    • Spark kullanılarak, tweet verilerinden duygu skorları hesaplanmıştır. HuggingFace kütüphanesinden ‘Distilbert-base-uncased-finetuned-sst-2-english’ modelinden faydalanılmıştır.
    • Veriler, 0-100 arasında duygu skorları üretmek için işlenmiştir ve bu skorlar görselleştirilmiştir.
  3. Zaman Serisi Modelleme:
    • Zaman serisi verisinin durağanlık testi yaptık. Ayrıca veriyi, ARIMA ve LSTM modelleri ile modelledik.
    • ARIMA modeli, kısa vadeli tahminlerde daha başarılı olduğu için tercih edilmiştir.
  4. Model Değerlendirmesi ve Tahminler:
    • ARIMA modeli, en iyi performansı gösteren model olarak seçilmiştir ve 1, 3, 7 günlük zaman dilimlerine yönelik tahminler yapılmıştır.
    • Sonuçlar interaktif bir kontrol paneli üzerinde görselleştirilmiştir.

Çalışmada Kullanılan Modeller

  • ARIMA (Autoregressive Integrated Moving Average): Zaman serisi verilerinde geleceği tahmin etmek için kullanılmıştır.
  • LSTM (Long Short-Term Memory): Kısa vadeli tahminlerde duygu skorlarının hassasiyetini artırmak amacıyla kullanılmıştır.

Sonuç

Bu çalışmada, Twitter verisi üzerinde yapılan duygu analizi ve zaman serisi modelleme, duygu skoru tahminlerinde yüksek doğruluk sağlamıştır. ARIMA modeli, duygu skorları için en iyi tahmin sonuçlarını vermiştir. Gelecekteki tweet duygu skorları 1, 3 ve 7 günlük zaman dilimlerinde başarılı bir şekilde tahmin edilmiştir.

Daha fazla bilgi almak için bize ulaşın. Birlikte, projelerinizi yürütelim!