1950 2006 yılları arasındaki Türkiye yağış verilerinin tanımlayıcı veri madenciliği yöntemleri ile analizi

2011-05-01
Asar, Özgür
Kartal, Elçin
Aslan, Sipan
Öztürk, Muhammed Zeynel
Yozgatlıgil, Ceylan
Çınar, İsmail
Batmaz, İnci
Köksal, Gülser
Tatlı, Hasan
Turkes, Murat
İstatistiksel analizlere başlamadan önce, mevcut veri kümesinin hem özelliklerini tanıma hem de veri girişi sürecinde yapılmış olması olası hataların belirlenmesi açısından tanımlayıcı istatistiklerin ayrıntılı analizinin yapılması çok önemlidir [1]. Ayrıca tanımlayıcı istatistikler yardımıyla elde edilen aykırı gözlemler incelenerek, gelecekte meydana gelebilecek doğal felaketler için erken uyarı sistemleri geliştirilebilir. Bu amaçla tanımlayıcı veri madenciliği araştırmacılara birçok yöntem sunmaktadır [2]. Bu çalışmada, Türkiye’nin 1950-2006 yılları arasında 277 istasyonunda kayıtlı aylık toplam yağış verisinin herbirinin türdeş olup olmadıkları Friedman Test, Standart Normal Homojenlik Testi (SNHT), Wilcoxon Testi, Tekrarlı Varyans Analizi (RANOVA) gibi yöntemlerle test edilip, türdeş olmayanlar türdeş hale getirildikten sonra tanımlayıcı veri madenciliği yöntemleri ile istatistik analizi yapılmıştır. İlgilenilen belli başlı tanımlayıcı istatistikler aylık seriler üzerinden, maksimum ve minimum değerler, ortalama, standart sapma, kartil ve aykırı gözlem değerleridir. Ayrıca her istasyonun 57 yıllık süreçte aylık kayıp gözlem sayıları ve yüzdeleri de hesaplanmıştır. Bunun yanısıra, aynı veri kümesine kayıp gözlemler, aykırı gözlemler, istasyon tipi (kır, kent) ve istasyonun ait olduğu bölge gözönünde bulundurularak istatistiksel grafik analizler de uygulanmıştır. Kayıp gözlemlerin bölgelere göre dağılışı incelendiğinde en fazla kayıp gö zlemin Doğu Anadolu Bölge’sinde ve toplam gözlenmesi gereken gözlemlerin yaklaşık olarak yüzde 25’i olduğu belirlenmiştir. Doğu Anadolu Bölgesi’ni yaklaşık yüzde 20’lik kayıp gözlem ile İç Anadolu Bölgesi izlemektedir. Diğer bölgeler ise yüzde 10 ile yüzde 15 arasında değişen kayıp gözlemleriyle bu iki bölgeyi izlemektedir. Yıllara göre kayıp gözlemlerin dağılımı incelendiğinde ise 1950-1958 yılları arasında yüzde 50 ve üzerinde kayıp gözlem varken, sonraki yıllarda kayıp gözlem yüzdesi oldukça düşmektedir. Çalışmada bunların yanısıra elde edilen aykırı gözlemler kullanlarak zaman serisi analizi yardımıyla gelecek yıllar için aykırı gözlem ve eğilim tahminleri de yapılmıştır.
Citation Formats
Ö. Asar et al., “1950 2006 yılları arasındaki Türkiye yağış verilerinin tanımlayıcı veri madenciliği yöntemleri ile analizi,” presented at the 7. İstatistik Günleri Sempozyumu, 2010, Ankara, Turkey, 2011, Accessed: 00, 2021. [Online]. Available: https://hdl.handle.net/11511/87702.