Lupus Nefriti Etkili Genlerin Belirlenmesinde Makine Öğrenmesi Modellerinin Kullanımı

Loading...
Publication Logo

Date

2025

Journal Title

Journal ISSN

Volume Title

Publisher

Open Access Color

OpenAIRE Downloads

OpenAIRE Views

Research Projects

Journal Issue

Abstract

Bu tezde, nekroptozis hücre ölümü yoluna ait genler temel alınarak makine öğrenmesi (ML) yöntemlerinin lupus nefriti (LN) hastalarını sağlıklı kontrollerden ayırt etmedeki uygulanabilirliği incelenmiştir. Bu amaçla, LASSO, Random Forest ve SVM algoritmalarını içeren yapılandırılmış ML iş akışları tasarlanmıştır. Tüm modeller; standart ön işleme adımlarının uygulanması, verilerin %70 eğitim ve %30 test setine ayrılması, ölçekleme, özellik seçimi için 10 katlı çapraz doğrulama, hiperparametre optimizasyonu ve %70'lik eğitim verisi üzerinde modelin nihai olarak eğitilmesi gibi ortak bir çerçeveye dayandırılmıştır. Sınıflandırma performansı, ayrılan %30'luk test verisi üzerinde ROC eğrileri ve karışıklık matrisleri kullanılarak değerlendirilmiştir. Üç modelin de yüksek doğrulukta sınıflandırma başarısı gösterdiği saptanmıştır. Modellerin kesişiminde, LN tanısı açısından biyolojik olarak anlamlı ve potansiyel biyobelirteç niteliğinde beş merkez gen öne çıkmıştır. Elde edilen bulgular, makine öğrenmesi yaklaşımlarının LN'nin doğru sınıflandırılmasında ve tanısal açıdan kritik genlerin belirlenmesinde güçlü ve güvenilir bir yöntem sunduğunu ortaya koymaktadır. Ayrıca bu yaklaşım, tekrarlanabilir ve biyolojik açıdan anlamlı içgörüler sağlayarak literatüre katkı sunmaktadır. Gelecekte yapılacak çalışmalar, bu genlerin daha geniş hasta kohortlarında doğrulanmasıyla öngörü performansının daha kapsamlı bir şekilde değerlendirilmesine imkân tanıyacaktır.
In this thesis, we investigated the feasibility of machine learning (ML) for distinguishing patients with lupus nephritis (LN) from healthy controls using necroptosis cell death pathway genes. Structured ML pipelines incorporating LASSO, Random Forest, and SVM models were employed. All three models followed a consistent framework, which included standardized preprocessing, a 70/30 training–test split, scaling, 10–fold cross-validation for feature selection, hyperparameter tuning, and training on the full 70% training set. Classification performance was addressed on 30% test data and evaluated using ROC curves and confusion matrices. All three models achieved excellent classification performance. The intersection of all three models identified five hub genes highly relevant for LN diagnosis, hence, offering potential biomarkers. Overall, this work indicated that ML can precisely classify LN, select diagnostic genes, and provide reproducible and biologically meaningful insights. Future studies may validate these genes in larger cohorts for further evaluation of predictive performance.

Description

Keywords

Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control

Turkish CoHE Thesis Center URL

Fields of Science

Citation

WoS Q

Scopus Q

Source

Volume

Issue

Start Page

End Page

180

Collections

Google Scholar Logo
Google Scholar™

Sustainable Development Goals

SDG data could not be loaded because of an error. Please refresh the page or try again later.