Yerlikaya Özkurt, Fatma

Doktor Öğretim Üyesi
    Çoklu bağlantı sorunu durumunda küçültme yöntemlerinin karşılaştırılması ve değerlendirilmesi
    (2022) Kılıçoğlu, Şevval; Yerlikaya Özkurt, Fatma; Özkurt, Fatma Yerlikaya; Industrial Engineering
    Mühendislik, tıp, doğa ve sosyal bilimler gibi uygulamalı bilimlerin birçok alanında veri analizi ve veri yorumlamanın kullanımı artarak önem kazanmaktadır. Bu amaç doğrultusunda veri toplamak, analiz etmek ve yorumlamak için istatistiksel yöntemler kullanılmaktadır. Basitliği ve kolay yorumlanması nedeniyle, en çok tercih edilen istatistiksel analiz yöntemlerinden biri, çoklu doğrusal regresyondur. Bu regresyon modelleri, birden fazla bağımsız değişken ile bir bağımlı değişken arasındaki ilişkiyi tanımlar. Ancak bazen çoklu doğrusal regresyon modelinin uygulanacağı veri setlerinde bağımsız değişkenler arasında çoklu doğrusal bağlantı (iç ilişki) olduğu gözlemlenebilir. Bu da, modelde tahmin edilen katsayıların varyansının büyük ve yanlılıklarının düşük olmasına neden olmaktadır. Bu gibi durumlarda model tahminleri doğru sonuç vermeyebilir ve modelin güvenilirliği düşebilir. Veri setindeki değişkenler arasında çoklu doğrusal bağlantı varsa bunun önceden belirlenmesi büyük önem taşımaktadır. Bu amaç doğrultusunda kullanılan çok sayıda çoklu doğrusal bağlantı tespit etme yöntemi ve bu sorunu çözmek için geliştirilmiş çeşitli yöntemler bulunmaktadır. Çoklu doğrusal bağlantı problemini çözmek için en popüler ve güçlü yöntemler küçültme yöntemleridir. Küçültme yöntemleri, modelde tahmin edilen parametrelerin varyansını azaltarak çoklu doğrusal bağlantı sorununu en aza indirmeyi amaçlar. En çok tercih edilen küçültme yöntemlerinden olan Ridge Regresyon, Lasso ve Elastik Net modeldeki değişkenlerin katsayılarını direkt sıfır yapar veya sıfıra çok yaklaştırır. Bu tez çalışmasında, Ridge Regresyon, Lasso ve Elastik Net, farklı özelliklere sahip dokuz farklı simüle edilmiş veri setine uygulanmıştır. Simüle edilmiş veri setlerindeki bazı bağımsız değişkenler arasında çoklu doğrusal bağlantıyı oluşturmak için Copula fonksiyonu kullanılmıştır. Daha sonra, yukarıda bahsedilen küçültme yöntemlerinin tümü, üç tane gerçek hayat veri setine de uygulanmıştır. Bu veri setleri, boyutlarına göre küçük, orta ve büyük olarak sınıflandırılan simüle edilmiş veri setleri ile eşleştirilmiştir. Simüle edilmiş veri setlerine uygulanan küçültme yöntemlerinin doğruluğunu ölçmek için 10 Katlamalı Çapraz Doğrulama yaklaşımı uygulanmıştır. Bunun yanında, gerçek hayat veri setleri için, veri setini yalnızca bir eğitim ve bir test verisine ayırmaya dayanan hold-out yöntemi tercih edilmiştir. Tüm modeller oluşturulduktan sonra, hangi özelliklere sahip veri setlerinde hangi yöntemin daha iyi sonuç verdiğini belirlemek için her bir yöntem özelinde bazı performans ölçütleri hesaplanmıştır. Ortalama kare hatası (MSE), bağımsız değişken sayısına bağlı ortalama kare hatası (PMSE), R-kare, ortalama mutlak hata (MAE) ve açıklanan varyans, karar verme aşamasında kullanılan performans ölçütleridir. Performans sonuçlarından yola çıkarak, küçültme yöntemleri çok kriterli karar verme yöntemlerinden biri olan TOPSIS ile karşılaştırılmış ve her bir veri seti için yöntemlerin tercih sırası belirlenmiştir. Tüm performans ve TOPSIS sonuçları incelendiğinde, genellikle küçük veri setlerinde en iyi sonuçları ridge regresyonunun verdiği, veri seti büyüdükçe yani karmaşıklık arttıkça küçültme yöntemlerinin tahmin edilen katsayıların varyansını azaltmak için değişken seçimi yapma eğiliminde olduğu ve bu yüzden de lasso ve elastik net modellerinin daha iyi sonuçlar verdiği görülmektedir. Modeller arasında genel bir sıralama yapılacak olursa lasso, elastik net ve ridge regresyonu olarak sıralanabilir.
    Evaluation of Multivariate Adaptive Regression Splines for Prediction of Kappa Factor in Western Türkiye
    (Springer Science and Business Media Deutschland GmbH, 2024) Yerlikaya Özkurt, Fatma; Yerlikaya-Ozkurt,F.; Askan,A.; Industrial Engineering
    The recent seismic activity on the west coast of Türkiye, including the Aegean Sea region, indicates that a closer focus is necessary on this region. Located in an active tectonic regime of north–south extension with multiple basins on soft soil deposits, the region has a high seismic hazard. Recently, as a combination of basin effects and building vulnerability, the October 30, 2020, Samos event (Mw = 7.0) caused localized significant damage and collapse in İzmir city center despite the 70 km distance from the earthquake source. In spite of this activity, studies on site characterization and site response modeling, including local velocity models and kappa estimates, are still limited in this region. Kappa values exhibit regional characteristics, which necessitates local kappa estimates from past earthquake data for use in region-specific applications. To make the prediction, we used three-component strong ground motion records from accelerometer stations with known VS30 values in western Türkiye that are a part of the Disaster and Emergency Management Presidency’s Turkish National Strong Ground Motion Observation Network. Multiple linear regression (MLR) and multivariate adaptive regression splines (MARS) algorithms have been implemented to build the prediction model. Three factors, such as distance, magnitude, and site class, are included in the kappa evaluation process. The performance of the models in kappa evaluation is calculated based on well-known accuracy measures. The MARS model showed better performance compared to MLR over the selected sites concerning all performance measures. This finding may challenge the most commonly assumed linear models of kappa in the literature. © The Author(s), under exclusive license to Springer Nature Switzerland AG 2024.
    Strategic Electricity Production Planning of Turkey via Mixed Integer Programming Based on Time Series Forecasting
    (Mdpi, 2023) Baç, Uğur; Bac, Ugur; Ünlü, Kamil Demirberk; Yerlikaya Özkurt, Fatma; Industrial Engineering
    This study examines Turkey's energy planning in terms of strategic planning, energy policy, electricity production planning, technology selection, and environmental policies. A mixed integer optimization model is proposed for strategic electricity planning in Turkey. A set of energy resources is considered simultaneously in this research, and in addition to cost minimization, different strategic level policies, such as CO2 emission reduction policies, energy resource import/export restriction policies, and renewable energy promotion policies, are also considered. To forecast electricity demand over the planning horizon, a variety of forecasting techniques, including regression methods, exponential smoothing, Winter's method, and Autoregressive Integrated Moving Average methods, are used, and the best method is chosen using various error measures. The optimization model constructed for Turkey's Strategic Electricity Planning is obtained for two different planning intervals. The findings indicate that the use of renewable energy generation options, such as solar, wind, and hydroelectric alternatives, will increase significantly, while the use of fossil fuels in energy generation will decrease sharply. The findings of this study suggest a gradual increase in investments in renewable energy-based electricity production strategies are required to eventually replace fossil fuel alternatives. This change not only reduces investment, operation, and maintenance costs, but also reduces emissions in the long term.
    cmaRs: A powerful predictive data mining package in R
    (Elsevier, 2023) Yerlikaya Özkurt, Fatma; Yazici, Ceyda; Batmaz, Inci; Industrial Engineering
    Conic Multivariate Adaptive Regression Splines (CMARS) is a very successful method for modeling nonlinear structures in high-dimensional data. It is based on MARS algorithm and utilizes Tikhonov regularization and Conic Quadratic Optimization (CQO). In this paper, the open-source R package, cmaRs, built to construct CMARS models for prediction and binary classification is presented with illustrative applications. Also, the CMARS algorithm is provided in both pseudo and R code. Note here that cmaRs package provides a good example for a challenging implementation of CQO based on MOSEK solver in R environment by linking R MOSEK through the package Rmosek.
    Estimation in the partially nonlinear model by continuous optimization
    (Taylor & Francis Ltd, 2021) Yerlikaya Özkurt, Fatma; Taylan, Pakize; Tez, Mujgan; Industrial Engineering
    A useful model for data analysis is the partially nonlinear model where response variable is represented as the sum of a nonparametric and a parametric component. In this study, we propose a new procedure for estimating the parameters in the partially nonlinear models. Therefore, we consider penalized profile nonlinear least square problem where nonparametric components are expressed as a B-spline basis function, and then estimation problem is expressed in terms of conic quadratic programming which is a continuous optimization problem and solved interior point method. An application study is conducted to evaluate the performance of the proposed method by considering some well-known performance measures. The results are compared against parametric nonlinear model.
    Konut Piyasalarında Makroekonomik Faktörlerin Etkisi: ABD Örneği
    (2021) Yerlikaya Özkurt, Fatma; Kestel, A. Sevtap Selçuk; Özkurt, Fatma Yerlikaya; Industrial Engineering
    Bu makale makroekonomik, finansal ve emtia piyasaları göstergelerinin konut piyasaları üzerindeki etkisini analiz etmektedir. Genelleştirilmiş Doğrusal Modeller (GDM) ve Çok Değişkenli Uyarlanabilir Regresyon Eğrileri (ÇDRE) tarafından üretilen modellerin yeterliliğini konut piyasası eğilimini tahmin etmek için bağımsız ölçüm yöntemlerine göre karşılaştırıyoruz. Araştırmalarımıza göre bu modeller ilk kez makroekonomik göstergelerin konut piyasaları üzerindeki etkisini ve konut piyasalarındaki eğilimine yönelik tahmini belirlemekte kullanılmaktadır. Ampirik çalışmalar, ABD konut piyasalarına odaklanmakta ve önerilen modellerin gösterimi Ocak 1999-Haziran 2018 periyodu arasında gözlemlenen aylık S\\&P/Case-Shiller Ulusal Konut Fiyat İndeksine ve ABD macroeconomic faktörlerine uygulanmaktadır. Bu çalışma makro ekonomik göstergeler ve konut piyasaları arasındaki etkileşimi vurgulayarak ve konut piyasalarının mekanizmasını analiz ederek literatüre katkıda bulunmaktadır. Bulguları, konut fiyat eğilimlerinin daha doğru bir şekilde tahmin edildiğini ve bu modellerin açıklayıcı değişkenlerin ortak etkisini yakaladığını göstermektedir. Ayrıca, ÇDRE yönteminin tahmin ve geleceğe yönelik tahmin gücüne kıyasla GDM'den daha iyi performans gösterdiğini ortaya koymuştur.
    A new outlier detection method based on convex optimization: application to diagnosis of Parkinson's disease
    (Taylor & Francis Ltd, 2021) Bilgiç, Burcu; Yerlikaya-Ozkurt, Fatma; Yerlikaya Özkurt, Fatma; Weber, Gerhard-Wilhelm; Department of Electrical & Electronics Engineering; Industrial Engineering
    Neuroscience is a combination of different scientific disciplines which investigate the nervous system for understanding of the biological basis. Recently, applications to the diagnosis of neurodegenerative diseases like Parkinson's disease have become very promising by considering different statistical regression models. However, well-known statistical regression models may give misleading results for the diagnosis of the neurodegenerative diseases when experimental data contain outlier observations that lie an abnormal distance from the other observation. The main achievements of this study consist of a novel mathematics-supported approach beside statistical regression models to identify and treat the outlier observations without direct elimination for a great and emerging challenge in humankind, such as neurodegenerative diseases. By this approach, a new method named as CMTMSOM is proposed with the contributions of the powerful convex and continuous optimization techniques referred to as conic quadratic programing. This method, based on the mean-shift outlier regression model, is developed by combining robustness of M-estimation and stability of Tikhonov regularization. We apply our method and other parametric models on Parkinson telemonitoring dataset which is a real-world dataset in Neuroscience. Then, we compare these methods by using well-known method-free performance measures. The results indicate that the CMTMSOM method performs better than current parametric models.
    (American Institute of Mathematical Sciences, 2024) Kılıçoğlu,Ş.; Kılıçoğlu, Şevval; Yerlikaya Özkurt, Fatma; Industrial Engineering
    Streszczenie. Data analysis is very important in many fields of science. The most preferred methods in data analysis is linear regression due to its simplicity to interpret and ease of application. One of the assumptions accepted while obtaining linear regression is that there is no correlation between the independent variables in the model which refers to absence of multicollinearity. As a result of multicollinearity, the variance of the parameter estimates will be high and this reduces the accuracy and reliability of the linear models. Shrinkage methods aim to handle the multicollinearity problem by minimizing the variance of the estimators in linear model. Ridge Regression, Lasso, and Elastic-Net methods are applied to different simulated data sets with different characteristics and also real world data sets. Based on performance results, the methods are compared according to multi-criteria decision making method named TOPSIS, and the order of preference is determined for each data set. © (2024), (American Institute of Mathematical Sciences). All rights reserved.
    Prediction of potential seismic damage using classification and regression trees: a case study on earthquake damage databases from Turkey
    (Springer, 2020) Yerlikaya Özkurt, Fatma; Askan, Aysegul; Industrial Engineering
    Seismic damage estimation is an important key ingredient of seismic loss modeling, risk mitigation and disaster management. It is a problem involving inherent uncertainties and complexities. Thus, it is important to employ robust approaches which will handle the problem accurately. In this study, classification and regression tree approach is applied on damage data sets collected from reinforced concrete frame buildings after major previous earthquakes in Turkey. Four damage states ranging from None to Severe are used, while five structural parameters are employed as damage identifiers. For validation, results of classification analyses are compared against observed damage states. Results in terms of well-known classification performance measures indicate that when the size of the database is larger, the correct classification rates are higher. Performance measures computed for Test data set indicate similar success to that of Train data set. The approach is found to be effective in classifying randomly selected damage data.
    Modeling of kappa factor using multivariate adaptive regression splines: application to the western Türkiye ground motion dataset
    (Springer, 2024) Yerlikaya Özkurt, Fatma; Yerlikaya-Ozkurt, Fatma; Askan, Aysegul; Industrial Engineering
    The recent seismic activity on Turkiye's west coast, especially in the Aegean Sea region, shows that this region requires further attention. The region has significant seismic hazards because of its location in an active tectonic regime of North-South extension with multiple basin structures on soft soil deposits. Recently, despite being 70 km from the earthquake source, the Samos event (with a moment magnitude of 7.0 on October 30, 2020) caused significant localized damage and collapse in the Izmir city center due to a combination of basin effects and structural susceptibility. Despite this activity, research on site characterization and site response modeling, such as local velocity models and kappa estimates, remains sparse in this region. Kappa values display regional characteristics, necessitating the use of local kappa estimations from previous earthquake data in region-specific applications. Kappa estimates are multivariate and incorporate several characteristics such as magnitude and distance. In this study, we assess and predict the trend in mean kappa values using three-component strong-ground motion data from accelerometer sites with known VS30 values throughout western Turkiye. Multiple linear regression (MLR) and multivariate adaptive regression splines (MARS) were used to build the prediction models. The effects of epicentral distance Repi, magnitude Mw, and site class (VS30) were investigated, and the contributions of each parameter were examined using a large dataset containing recent seismic activity. The models were evaluated using well-known statistical accuracy criteria for kappa assessment. In all performance measures, the MARS model outperforms the MLR model across the selected sites.