Twitter Duygu Analizi Çalışması | Biontech ve Sinovac Hakkındaki Düşünceler
GTech Büyük Veri ve Analitik Departmanı olarak Twitter verileri üzerinden Covid-19 aşıları hakkında insanların düşüncelerini ve olası kaygılarını ölçtük. İleri analitik uzmanlığımız ile hazırladığımız Twitter Duygu Analizi çalışmamızda, Doğal Dil İşleme (NLP) Yöntemleri kullanılmıştır. Doğal dil işleme yöntemleri metin dosyalarını derin öğrenme modelleri kullanarak matematiksel veriye çevirir ve çeşitli analizlere imkân sağlar. Çalışmamızda bu veri dönüşümü kullanılarak insanların belli bir konuda negatif mi pozitif mi yoksa nötr mü düşündükleri üzerine modelleme yapılmıştır.
Twitter API’ı üzerinden toplanan tweetler Python üzerinden doğal dil işleme modeli yardımıyla skorlanmıştır. Skorlama sonucu ilgili tweetin Negatif (-1), Nötr (0) ya da Pozitif (1) düşünce içerdiğine bağlı olarak etiketlenmiştir. Elde edilen bu etiketlerden hareket edilerek kişilerin; coğrafi konumu, kullanılan cihaz türü, tweet’in atılma tarihi, beğeni sayısı gibi ek bilgiler kullanılarak profilleri çıkartılmıştır. Çalışmada, aşılar hakkında negatif düşünceler içeren tweetler incelenerek insanların hangi sebeplerden aşılara olumsuz baktığı incelenmiştir. Son olarak da aşılama periyodlarındaki duygu değişimleri gözlemlenmiştir.
Çalışmada Haziran – Ekim 2021 arasında atılan tweetler kullanılmıştır. Çalışma içerisinde kullanılan veri, #biontech ve #sinovac hashtagi içeren tweetlerden oluşmaktadır. Twitter API’ı üzerinden haftalık olarak çekilmiştir. Twitter API’ndan gelen veriyi temizlemek ve modellemeye hazır hale getirebilmek için farklı ön hazırlık işlemleri uygulanmıştır.
- Konum bilgileri şehir düzeyine taşındı.
- Link içeren Tweetlerdeki linkler kaldırıldı.
- Büyük harfler küçük harfe çevrildi.
- Stopwords kelimeleri analizden çıkartıldı.
- Noktalama işaretleri kaldırıldı.
Toplamda 12267 Tweetten oluşan veri setinde API gelen bilgiler üzerinden aşağıdaki bilgi alanları seçilip analizde kullanılmıştır.
- Konum Bilgisi
- Tarih Bilgisi
- Beğeni Toplamı
- Hashtagleri
- Tweet’in Atıldığı Cihaz
- Tweet ID’si
- Tweet Metni
Modelleme
Modelleme kısmında hazır hale getirilmiş tweetler, Bert-Based-Turkish-Sentiment-Cased isimli modele sokulmuştur. BERT (Bidirectional Encoder Representations from Transformers) modelleri yapısal olarak kullanılan kelimeler arasında çift taraflı model eğitimine imkân sağlanan derin öğrenme modelleridir. Turkish NLP Topluluğu tarafından eğitilen bert-based-turkish-sentiment-cased modeli Turkish OSCAR corpus kelime sözlüğü kullanılarak eğitilmiştir. Bu kelime sözlüğü kısaca Wikipedia sitesinde bulunan her kelimeyi içermektedir. Kelime sözlüğünün final hali yaklaşık 35 GB yer kaplamaktadır. Model, çıktı olarak her tweet için negatif (-1), nötr (0) ve pozitif (1) şeklinde etiketleme işlemi gerçekleştirmiştir.
Sıklıkla kullanılan kelimelere baktığımızda insanların genel olarak aşı olduklarını ilan etmeyi sevdiklerini, yan etkilerden çekindikleri ve pandemi gelişmelerini yakından takip ettikleri gözlemlenmiştir.
Çalışmada kullanılan tweetlerin atıldığı cihaz dağılımına baktığımızda kullanıcıların yüksek oranda Android cihaz kullandıkları gözlemlenmiştir.
Çalışmada kullanılan tweetlerin atıldığı şehir dağılımına baktığımızda kullanıcıların yüksek oranda İstanbul’dan, İstanbul harici de genellikle büyükşehirlerden tweet attıkları gözlemlenmiştir.
Biontech
Türkiye geneline bakıldığında çalışma kapsamında toplanan tweetlerin yarısında Biontech aşısı hakkında olumlu tweet attığını gözlemlenmiştir.
Biontech hakkında atılan tweetlerin aldığı beğenme sayıları incelendiğinde pozitif tweetlerin toplamda 3000’den fazla beğeni aldığı gözlemlenirken, negatif tweetlerin 2500 beğeni barajını aşamadığını gözlemlemekteyiz. Bu durum insanların Biontech aşısı özelinde olumlu görüşleri daha çok desteklediğini göstermektedir.
Üç büyük şehrimize baktığımızda, özellikle pandeminin ilk aylarını yüksek vaka sayılarıyla geçiren Ankara’da %62 gibi yüksek bir oranla Biontech aşısı hakkında destekleyici tweetler atıldığını gözlemlemekteyiz. Aynı oran İstanbul’da %52,5’ken, İzmir kentinde pozitif tweet oranlarının yüzde ellinin altına düştüğünü ve diğer kentlere oranla en yüksek oranda nötr tweet atıldığı görülmektedir. İzmir’deki twitter kullanıcılarının diğer şehirlerde yaşayan kullanıcılara oranla aşı ve aşılama çalışmalarına daha şüpheci yaklaştığı çıkarımına bu verilerden varılabilir.
Biontech aşısı hakkında atılan negatif tweetler incelendiğinde, insanların şikayetçi olduğu konularda ortak başlıklar gözlemlenmiştir. İnsanların yaklaşık %15’i geçirdiği yan etkilerden şikayetçi olurken, %11’lik bir küme aşı olmasına rağmen covid-19 hastalığına yakalandığından şikâyet etmektedir.
İnsanların özellikle yan etkilerden şikayetçi olduğu Biontech aşılama çalışmaları kapsamında, Temmuz’un ortasına denk gelen nüfusun büyük çoğunluğunun 2. doz aşılamalarının yapıldığı tarihlere göz atıldığında, 15 Temmuz sonrasında, Biontech aşısı hakkındaki olumlu düşüncelerin 4 puan azalarak %50’ye gerilediği görülmektedir.
Sinovac
Türkiye geneline bakıldığında çalışma kapsamında toplanan tweetlerin yarısından fazlasında Sinovac aşısı hakkında olumlu tweet attığını gözlemlenmiştir.
Sinovac hakkında atılan tweetlerin aldığı beğenme sayıları incelendiğinde pozitif tweetlerin toplamda 1000’den fazla beğeni aldığı gözlemlenirken, negatif tweetlerin 800 beğeni barajını aşamadığını gözlemlemekteyiz. Bu durum insanların Sinovac aşısı özelinde olumlu görüşleri daha çok desteklediğini göstermekle birlikte, Sinovac aşısının Biontech aşısı kadar kullanıcıların ilgisini çekemediğini göstermektedir.
Üç büyük şehrimize baktığımızda; İstanbul’da ikamet eden kullanıcıların %57’sinin, Ankaralı kullanıcıların da yarısının Sinovac aşısı hakkında olumlu düşüncelere sahip olduğu gözlemlenmektedir. Ancak İzmirli kullanıcıların olumlu ve olumsuz tweetlerinin arasında sadece %4’lük bir fark gözlemlenip olumlu tweetlerin oranı %50’nin altına düşmüştür. Bu durum da İzmirli kullanıcıların Sinovac aşısına Biontech aşısına oranla daha da şüpheci yaklaştığını göstermektedir.
Temmuz ortasına tekrar dönüldüğünde Sinovac aşısının 15 Temmuz’dan sonra tıpkı Biontech aşısında olduğu gibi güven kaybettiği ve pozitif tweet oranının tam 7 puan düştüğü gözlemlenerek %57’ye gerilediği gözlemlenmiştir.
Sonuç olarak, çalışma kapsamında insanların genel olarak aşılara daha olumlu baktığı ve olumlu bakış açılarının daha geniş kitlelerce desteklendiği gözlemlenmiştir. Pozitif tweet paylaşan kullanıcıların büyük çoğunluğu diğer insanları da aşı olmaya davet edip toplumsal bilinç oluşturmaya çalıştığı görülmüştür. Negatif tweetlerde özellikle aşıların virüse karşı etkisini sorgulanması ve yan etkileri konularının ciddi oranda etkili olduğu görülmüştür. Aşılanma çalışmalarının yoğunlaştığı dönemlerde de genel düşüncenin negatif yönde bir hareket sergilediği gözlemlenmiştir.
GTech Büyük Veri ve Analitik Departmanı’mızın uzmanlık alanlarından biri olan Doğal Dil İşleme (NLP) yöntemleriyle siz de şirketinizin herhangi bir sosyal medyada aldığı geri dönüşleri takip edebilir, farklı zamanlardaki duygu ve düşünce değişimlerini monitor edebilirsiniz. Detaylı bilgi için bize ulaşabilirsiniz.
Çalışmayı Hazırlayanlar:
Selami Tunç Ergene, GTech Veri Bilimci
Celal Akçelik, GTech Büyük Veri Danışmanı
Mert Musaoğlu, GTech Veri Bilimci