Publication: Uydu Verilerine Dayalı Zaman Serileri ile Makine Öğrenmesi ve Derin Öğrenme Algoritmaları Kullanılarak Samsun İlinde Yağış Tahmini
Abstract
Yağış, tahmin edilmesi en zor olan meteorolojik parametreler biridir. Bir bölgenin yağış miktarının tahmin edilmesi, sel ve kuraklık gibi doğal afetlere karşı önlem alınması, erken uyarı sistemleri, tarımsal faaliyetlerin planlanması, su kaynakları yönetimi ve sigorta kayıplarının öngörülmesi gibi birçok alanda kritik öneme sahiptir. Yapay zeka alanında özellikle makine öğrenmesi ve derin öğrenme algoritmalarındaki gelişmeler, yağış tahmini çalışmalarında önemli bir potansiyel sunmaktadır. Yağış tahmin doğruluğunun artırılmasının ve uydu verilerinin bu alandaki potansiyelinin ortaya çıkarılmasının hedeflendiği bu tez çalışmasında, Samsun iline ait 2014-2023 yıllarını kapsayan 10 yıllık dönem verileri kullanılarak makine öğrenmesi ve derin öğrenme algoritmalarına dayalı yağış tahmini gerçekleştirilmiştir. Çalışmada, TERRA ve AQUA uydularının MODIS ve AIRS sensörlerinden elde edilen 12 farklı parametreye ait uydu görüntüleri ile Meteoroloji Genel Müdürlüğü (MGM)'nün meteoroloji istasyonlarından temin edilen yağış verileri analiz edilmiştir. Veriler, aylık ortalama değerler olarak zaman serileri formatında değerlendirilmiştir. Çalışmada; toplam yağışa dönüşebilir su buharı, kar örtüsü, arazi yüzeyi sıcaklığı, deniz yüzey sıcaklığı, buharlaşma, bulut, aerosol, ozon gazı, basınç, bitki örtüsü indeksi, nem ve arazi örtüsü gibi meteorolojik, atmosferik ve çevresel parametreler kullanılmıştır. Doğrusal Regresyon (LR), Rastgele Orman, Ekstrem Gradyan Artırma (XGBoost), Hafif Gradyan Artırma Makinesi (LightGBM), Uzun Kısa Süreli Bellek (LSTM) ve Kapılı Tekrarlayan Birim (GRU) modelleri ile yağış tahmin çalışmaları gerçekleştirilmiş ve LSTM ile geleceğe dair kestirimler yapılmıştır. Modellerin performanslarını değerlendirmek için Ortalama Mutlak Hata (MAE), Ortalama Kare Hata Karekökü (RMSE) ve Belirleme Katsayısı (R²) ölçütleri kullanılmıştır. Tez çalışması sonuçlarına göre, LightGBM modeli eğitim hızıyla öne çıkarken, test doğruluğu açısından en iyi performans %86 doğrulukla LSTM modelinden elde edilmiştir. LSTM modeline göre yağışı etkileyen en önemli parametreler, nem ve arazi yüzey sıcaklığı olmuştur. Zaman serisi analizine uygunluğu nedeniyle LSTM modellerinin gelecekteki yağış tahmini çalışmalarına katkı sağlayacağı ve derin öğrenme modellerinin meteorolojik araştırmalar için temel oluşturacağı düşünülmektedir.
Rainfall is one of the most challenging meteorological parameters to predict. Accurate rainfall estimation is crucial for taking preventive measures against natural disasters such as floods and droughts, developing early warning systems, planning agricultural activities, managing water resources, and forecasting insurance losses. Recent advancements in artificial intelligence, particularly in machine learning and deep learning algorithms, offer significant potential for improving rainfall prediction. This thesis aims to enhance rainfall prediction accuracy and explore the potential of satellite data in this field. Using a dataset covering a 10 year period (2014-2023) for Samsun, Turkey, rainfall predictions were conducted based on machine learning and deep learning algorithms. The study utilized satellite images of 12 different parameters obtained from the MODIS and AIRS sensors of the TERRA and AQUA satellites, along with rainfall data from meteorological stations of the Turkish State Meteorological Service (MGM). The data were analyzed in a time-series format with monthly average values. In the study, meteorological, atmospheric, and environmental parameters such as total precipitable water vapor, snow cover, land surface temperature, sea surface temperature, evapotranspiration, clouds, aerosol, ozone, pressure, vegetation index, humidity, and land cover were used. Rainfall prediction studies were evaluated using Linear Regression (LR), Random Forest (RF), Extreme Gradient Boosting (XGBoost), Light Gradient Boosting Machine (LightGBM), Long Short-Term Memory (LSTM), and Gated Recurrent Unit (GRU) models, with future predictions made using the LSTM model. Model performance was evaluated using the metrics Mean Absolute Error (MAE), Root Mean Square Error (RMSE), and Coefficient of Determination (R²). The results of the study indicate that while the LightGBM model stood out in terms of training speed, the LSTM model achieved the highest test accuracy with 86%. According to the LSTM model, the most influential parameters affecting rainfall were humidity and land surface temperature. Due to its suitability for time-series analysis, LSTM models are expected to contribute to future rainfall prediction studies, and deep learning models are anticipated to form a foundation for meteorological research.
Rainfall is one of the most challenging meteorological parameters to predict. Accurate rainfall estimation is crucial for taking preventive measures against natural disasters such as floods and droughts, developing early warning systems, planning agricultural activities, managing water resources, and forecasting insurance losses. Recent advancements in artificial intelligence, particularly in machine learning and deep learning algorithms, offer significant potential for improving rainfall prediction. This thesis aims to enhance rainfall prediction accuracy and explore the potential of satellite data in this field. Using a dataset covering a 10 year period (2014-2023) for Samsun, Turkey, rainfall predictions were conducted based on machine learning and deep learning algorithms. The study utilized satellite images of 12 different parameters obtained from the MODIS and AIRS sensors of the TERRA and AQUA satellites, along with rainfall data from meteorological stations of the Turkish State Meteorological Service (MGM). The data were analyzed in a time-series format with monthly average values. In the study, meteorological, atmospheric, and environmental parameters such as total precipitable water vapor, snow cover, land surface temperature, sea surface temperature, evapotranspiration, clouds, aerosol, ozone, pressure, vegetation index, humidity, and land cover were used. Rainfall prediction studies were evaluated using Linear Regression (LR), Random Forest (RF), Extreme Gradient Boosting (XGBoost), Light Gradient Boosting Machine (LightGBM), Long Short-Term Memory (LSTM), and Gated Recurrent Unit (GRU) models, with future predictions made using the LSTM model. Model performance was evaluated using the metrics Mean Absolute Error (MAE), Root Mean Square Error (RMSE), and Coefficient of Determination (R²). The results of the study indicate that while the LightGBM model stood out in terms of training speed, the LSTM model achieved the highest test accuracy with 86%. According to the LSTM model, the most influential parameters affecting rainfall were humidity and land surface temperature. Due to its suitability for time-series analysis, LSTM models are expected to contribute to future rainfall prediction studies, and deep learning models are anticipated to form a foundation for meteorological research.
Description
Citation
WoS Q
Scopus Q
Source
Volume
Issue
Start Page
End Page
149
