Öz
Amaç
Optik koherens tomografi (OKT) görüntülerinde yaşa bağlı maküla dejenerasyonu (YBMD) tespiti ve kuru ve yaş tip YBMD ayırt edilmesi için uzman tasarımı makine öğrenimi modelleri ile kodlama gerektirmeyen otomatik makine öğrenimi (AutoML) modellerinin etkinliğini karşılaştırmak.
Gereç ve Yöntem
Uzman modelleri, bir yapay zeka uzmanı tarafından EfficientNet V2 mimarisi kullanılarak geliştirilirken, AutoML modelleri bir oftalmolog tarafından ResNet-50 V2 ile transfer öğrenimini içeren LobeAI platformu kullanılarak oluşturulmuştur. Her iki model, normal OKT görüntülerini YBMD’den ayırt etmek ve ayrıca kuru tip YBMD ile yaş tip YBMD arasında sınıflama yapmak üzere tasarlanmıştır. Modeller, %80 eğitim ve %20 test bölünmesiyle, her tanı grubu için 500 OKT görüntüsü kullanılarak eğitilmiş ve test edilmiştir. Performans metrikleri (duyarlılık, özgüllük, doğruluk ve F1 skorları) hesaplanarak karşılaştırılmıştır.
Bulgular
Uzman tasarımı model, tüm görüntüleri sınıflamada %99,67 genel doğruluk sağlarken ve tüm ikili sınıf karşılaştırmalarında F1 skorları 0,99 veya daha yüksek olarak hesaplanmıştır. Buna karşılık, AutoML modeli %89,00 genel doğruluk sağlarken, ikili karşılaştırmalarda F1 skorları 0,86 ile 0,90 arasında değişmiştir. AutoML modelinde, kuru tip YBMD ile normal OKT’nin ayırt edilmesindeki duyarlılığın (0,85) düşük olduğu gözlenmiş olup, bu durum modelin kuru tip YBMD’yi doğru şekilde tanımakta zorluk çektiğini göstermektedir.
Sonuç
AutoML modelleri, YBMD olgularını tanımada ve sınıflamada kabul edilebilir bir performans sergilemiş olsa da, uzman tasarımı modeller önemli ölçüde daha üstün performans göstermiştir. Uzman tarafından geliştirilen modellerde kullanılan ileri sinir ağı mimarileri ve optimizasyon süreçleri, tıbbi görüntü sınıflama için yüksek hassasiyetli tanı araçlarının geliştirilmesinde uzman katkısının önemini vurgulamaktadır.
Giriş
Yaşa bağlı maküla dejenerasyonu (YBMD), 55 yaş üstü bireylerde görme kaybının önemli bir nedenidir ve 2040 yılına kadar dünya çapında 288 milyon insanı etkileyeceği tahmin edilmektedir.1 YBMD primer olarak makülayı tutarak fotoreseptörler ve retina pigment epitelinin (RPE) dejenerasyonuna yol açar.1 Klinik olarak, YBMD iki şekilde kendini gösterir: Drusen varlığı ile karakterize kuru YBMD ve anormal kan damarı büyümesi ile ilişkili olan ve genellikle hızlı ve ciddi görme kaybına neden olan yaş veya eksüdatif YBMD.1, 2 Optik koherens tomografi (OKT), YBMD tanısı ve izleminde kritik bir araçtır ve klinisyenlerin drusen varlığı, RPE anormallikleri ve koroidal neovasküler membranlar gibi önemli lezyonları tanımlamasına olanak sağlayan yüksek çözünürlüklü, kesitsel retina görüntüleri OKT ile elde edilebilir. OKT, anti-vasküler endotel büyüme faktörü tedavisi alan hastalarda kuru ve yaş YBMD’yi ayırt etmek, hastalık progresyonunu izlemek ve tedavi yanıtlarını değerlendirmek için özellikle değerlidir.1
Derin öğrenme (DÖ) modelleri, özellikle ileri mühendislik ürünü evrişimli sinir ağları (“convolutional neural networks”, CNN), tıbbi görüntülerin analizinde başarı göstermiştir. Bu DÖ modellerinin kullanıldığı birkaç çalışmada, YBMD’nin tanısı ve sınıflandırılmasında önemli başarı elde edilmiştir.3, 4, 5, 6, 7, 8, 9, 10, 11 Rasti ve ark.’nın3 çalışmasında olduğu gibi ilk çalışmalarda, veri setleri küçüktü ve Çok Ölçekli Evrişimsel Uzmanların Karması ve AlexNet gibi daha basit modeller kullanılmış ve sınırlı veriye rağmen kayda değer sınıflandırma performansı elde edilmiştir.4 Veri kümelerinin boyutu ve karmaşıklığı arttıkça, ResNet ve DenseNet gibi daha karmaşık mimariler kullanılmış ve çoğunlukla doğruluk, hassasiyet ve özgüllüğü artırmak için topluluk öğrenme yaklaşımlarıyla birleştirilmiş ve çoğu zaman bu ölçütlerde %99 oranı aşılmıştır.7, 8 Özellikle 2020’den sonra yapılan çalışmalar, longitudinal verileri işlemek için CNN ve tekrarlayan sinir ağlarını (“recurrent neural networks”) birleştiren hibrit modellere ve özellik tanımayı geliştirmek için öz dikkat mekanizmalarının entegrasyonuna odaklanmıştır.9, 10 Tablo 1, YBMD tanısı ve sınıflandırması için DÖ modellerinin kullanıldığı önceki çalışmaları özetlemektedir. Başarılı sonuçlar elde etmelerine rağmen, inşa etmesi ciddi teknik bilgi gerektirir. Bu nedenle bu alanda teknik uzmanlığa sahip olmayan doktorlar için bir zorluk oluşturur. Yakın zamanlarda geliştirilen, kod içermeyen otomatik makine öğrenimi (AutoML) platformlarının kullanıma girmesi, tıbbi görüntü sınıflandırması için umut verici bir yaklaşım olarak ortaya çıkmış ve hekimlerin kapsamlı kodlama bilgisi olmadan modelleri geliştirebilmelerine olanak sağlamıştır.12 AutoML sistemleri, veri ön işleme, özellik seçimi ve model optimizasyonu gibi ML ardışık işlemlerinin temel yönlerini otomatik olarak gerçekleştirir. Böylece ML’de uzman olmayanlar kişiler için başlangıçta karşılaşılan engelleri azaltır ve sağlıkta uzman kişilerin teknik karmaşıklıklardan ziyade klinik uygulamalara odaklanmasını sağlar.13 Farklı çalışmalarda diyabetik retinopati, retinal ven tıkanıklığı ve katarakt cerrahisi aşamaları gibi oftalmolojik hastalıklarda AutoML’nin başarısını değerlendirilmiştir.14, 15, 16
Bildiğimiz kadarıyla, daha önce OKT görüntüleri ile YBMD’nin tanısı ve sınıflandırılmasında AutoML modellerinin performansı uzmanlar tarafından geliştirilen modellerle karşılaştırılmamıştır. Bu nedenle, bu çalışmada, hekimlerin kendi başlarına doğru ve güvenilir sınıflandırma modelleri oluşturmak için AutoML araçlarından yararlanıp yararlanamayacağını veya mühendislik alanında uzmanlığın optimal performans için çok önemli olup olmadığını araştırmak için bu iki tekniğin performansını değerlendirmeyi ve karşılaştırmayı amaçladık.
Gereç ve Yöntem
Bu çalışma Helsinki Bildirgesi ilkelerine uygun olarak yürütüldü ve Dokuz Eylül Üniversitesi Etik Kurul’dan onay alındı (protokol kodu: 2024/37-06, onay tarihi: 06.11.2024). Çalışmada açık erişimli veri kümeleri kullanıldığı, hastalarla doğrudan iletişim kurulmadığı ve hastaların tanımlanmasından kullanılabilecek verilere yer verilmediği göz önüne alındığında, hasta onamı alınması gerekmedi.
Optik Koherens Tomografi Verileri
Gholami ve ark.17 tarafından 2020’de yayımlanan Optik Koherens Tomografi Görüntü Veritabanı ve Kermany ve ark.18 tarafından 2018’de yayımlanan Kaggle veri setinde yer alan maküla merkezli spektral alan OKT görüntülerini kullandık. İki deneyimli göz hekimi (C.D.E. ve D.Ö.) bu OKT görüntülerini değerlendirdi ve kuru YBMD ve yaş YBMD olarak gruplandırdı. Yaş YBMD, klinik tanı kriterlerine uygun olarak intraretinal sıvı, subretinal sıvı ve/veya subretinal hiperreflektif materyal varlığına bakılarak tanımlandı. Kuru YBMD grubuna ise drusenli ve eksüdasyon bulgusu olmayan olgular dahil edildi. Coğrafi atrofi olguları çalışmaya dahil edilmedi. Eşzamanlı başka herhangi bir retina hastalığı olan veya gürültü nedeniyle kalitesi yetersiz olan görüntüler çalışmaya dahil edilmedi. Görüntülerin tutarlı şekilde etiketlendiğini değerlendirmek için, Cohen’in kappa katsayısı kullanılarak iki göz hekiminin değerlendirmelerinin güvenilirliği ölçüldü. Cohen kappa katsayısı 0,987 idi. Bu değer OKT görüntülerinin sınıflandırılmasında mükemmel uyum olduğunu göstermektedir. Veri kümesi model eğitimi için kullanılmadan önce tutarsızlıklar fikir birliği ile çözüldü. Her gruba toplam 500 maküla merkezli OKT görüntüsü dahil edildi. Kontrol grubu olarak, aynı veri setlerinden herhangi bir retina patolojisi olmayan 500 normal spektral domain OKT görüntüsü dahil edildi. Tüm görüntüler 900x300 piksele kırpıldı ve JPEG formatına dönüştürüldü.
Modellerin Oluşturulması
Veri kümesi bölündü, her gruptaki görüntülerin %80’i modelleri eğitmek için kullanıldı ve kalan %20’si test için ayrıldı. Daha sonra, AutoML için LobeAI kullanılarak dört farklı model geliştirildi ve test edildi. Uzman tarafından modeller Python ortamında tasarlandı. Model I, yaş YBMD’yi normal görüntülerden ayırt etmek için, Model II, kuru YBMD’yi normal görüntülerden ayırt etmek için ve Model III, yaş YBMD’yi kuru YBMD’den ayırt etmek için eğitildi. Ayrıca, karmaşık bir sınıflandırma görevinde model performansını değerlendirmek için tüm patolojik ve normal OKT görüntüleri kullanılarak Model IV eğitildi. Her iki model türü de performanslarının adil bir şekilde karşılaştırılmasını sağlamak için aynı veri kümesi kullanılarak eğitildi ve test edildi.
Otomatik Makine Öğrenimi Modelleri
Lobe yazılımı (sürüm 0.10.1130.5) resmi websayfasından (https://www.lobe.ai/) indirilerek kişisel bilgisayara yüklendi. Kurulumdan sonra, görüntüler programa yüklendi ve üç etiket eklendi: Yaş YBMD, kuru YBMD ve normal. Lobe yazılımı, eğitim sürecinde her görüntünün otomatik olarak beş rastgele varyasyonunu oluşturur. Parlaklık, satürasyon ve kontrastı ayarlar, renk tonunu değiştirir, rotasyon, yakınlaştırma ve gürültü azaltma gibi teknikleri kullanır. Bu nedenle, başka bir veri artırma yöntemi kullanılmamıştır. Bu yazılım, mevcut görevdeki performansı artırmak için ilgili görevlerde önceden eğitilmiş modelleri kullanan ve sınırlı bir veri kümesinde bile yüksek doğruluk sağlayan bir yöntem olan transfer öğrenmeyi kullanır. ResNet-50 V2 CNN mimarisinin, Proje Ayarları menüsündeki “doğruluk için optimize et” seçeneği seçilmiştir. Görüntü sınıflandırması ve diğer görme görevlerindeki etkinliği ile bilinen 50 katmanlı bir CNN olan ResNet-50 He ve ark.19 tarafından geliştirilmiştir. Toplu normalizasyon ve ReLU aktivasyonunu evrişimli katmanlar olarak kullanan 4 set halinde gruplandırılmış 16 rezidüel bloktan oluşur. Ana konsept, girdiyi doğrudan bloğun çıkışına aktaran ve derin ağ optimizasyonuna yardımcı olan atlama bağlantısıdır. Model, global ortalamaların havuzda toplaması ve SoftMax ile tam bağlantılı bir katman ile tamamlanmaktadır. Eğitim aşamasından sonra, model performansını artırmak için uygulamanın kendi “model optimizasyonu” özelliği kullanılmış ve daha ileri iyileştirmeler yapılmıştır. AutoML modelleri için istatistiksel analizler MedCalc web sitesi (https://www.mdcalc.com/) kullanılarak gerçekleştirildi. Patolojik OKT görüntülerini normal görüntülerden ayırt etmek ve spesifik YBMD tipini tanımlamak için duyarlılık, özgüllük ve doğruluk hesaplandı. Ek olarak, Model IV’ün performansını daha kapsamlı değerlendirmek için Konfüzyon Matrisi Jeneratörü aracılığıyla bir karışıklık matrisi oluşturuldu.20
Uzman Tarafından Tasarlanan Modeller
Uzman tarafından tasarlanan model, bilgisayar mühendisliği ve biyomedikal teknolojiler konusunda deneyimi olan ve klinik ortamlarda görüntü işleme, makine öğrenmesi ve DÖ uygulamalarında uzmanlığa sahip bir yapay zeka uzmanı (U.B.) tarafından geliştirilmiştir. Bu modelin mimarisini tasarlamaktan, ön işleme ve artırma tekniklerini uygulamaktan, hiper parametreleri optimize etmekten ve model performansını doğrulamaktan uzman sorumluydu.
Tan ve Le21 tarafından geliştirilen EfficientNet modelleri, ResNet veya VGG gibi mimarilere kıyasla saniyede daha az parametre ve kayan nokta işlemi yaparak yüksek performans sergilemeyi amaçlamaktadır. Model derinliğini, genişliğini ve çözünürlüğünü en iyi şekilde dengeleyen bir yöntem olan “bileşik ölçeklendirme” yöntemini geliştirmişlerdir. Derinlik katman sayısını, genişlik katman başına kanal sayısını ve çözünürlük yüklenen görüntü boyutunu ifade eder ve EfficientNet’in farklı boyutlarda verimli bir şekilde ölçeklenmesine olanak tanır.
Modellerimiz için, OKT görüntüleri ile eğitim ve değerlendirme süreci, veri seti istatistiklerinin hesaplanmasıyla başlamıştır. Ortalama (µ) ve standart sapma (σ) eğitim setinden türetilmiştir. Daha sonra, bu istatistiklere dayalı olarak eğitim, doğrulama ve test setleri için tanımlanan dönüşümlerle veri önişleme ve artırma gerçekleştirilmiştir. Veri kümesi daha sonra eğitim ve doğrulama alt kümelerine bölünmüş ve DataLoaders buna göre oluşturulmuştur. Özel bir EfficientNetV2 mimarisine dayanan model sınıflandırma görevi için başlatıldı ve He başlatma kullanıldı. Kayıp fonksiyonu olarak, etiket yumuşatma çapraz entropi kullanıldı. Hiperparametre optimizasyonu, Optuna kullanılarak gerçekleştirildi. Optuna, hiperparametre alanını sistematik olarak araştırarak optimum konfigürasyonları belirlemek ve manuel ayar ihtiyacını en aza indirmek için tasarlanmış otomatik bir yazılım çerçevesidir.22 Optuna’da, öğrenme oranı (α), bırakma oranı (p) ve ağırlık azalması (λ) için arama alanları önce tanımlandı, daha sonra doğrulama
hassasiyetini en yüksek düzeye çıkarılarak optimal hiperparametreler (θ* = {α*, p*, λ*}) belirlendi. Eğitim aşamasında, optimizer optimal öğrenme oranı (α*) ve ağırlık azalması (λ*) ile başlatıldı. Aşırı uyum gösterme riskini azaltmak için en iyi bırakma oranı (p*) modele dahil edildi. Model, birçok kez eğitildi; her eğitimde, model parametreleri güncellenerek yapılan eğitim aşamasını doğrulama setindeki performansı değerlendirmek için doğrulama aşaması izledi. Doğrulama hassasiyetinde bir iyileşme gözlendiğinde model kontrol noktası kaydedildi. Eğitimin tamamlanmasının ardından, nihai model (M*) için istatistiksel metrikler doğrudan Python ortamında hesaplandı. Duyarlılık, özgüllük, hassasiyet, hatırlama ve F1 skorları scikit-learn kütüphanesi ile modelin tahminleri temel alınarak hesaplandı. Ayrıca, sınıflandırma performansını görselleştirmek için Python dilinde programatik olarak bir karışıklık matrisi oluşturuldu. Uzman model parametreleri ve eğitim ayarları Ek Tablo 1’de özetlenmiştir.
Bulgular
Lobe uygulaması kullanılarak geliştirilen ML modelleri, normal ile yaş veya kuru YBMD OKT görüntüleri arasında ayrım yapabilmiş ve sırasıyla %92,00 ve %90,00 duyarlılık ve %94,00 ve %91,00 özgüllük elde etmiştir. Buna karşılık, yaş ve kuru YBMD’yi normal OKT görüntülerinden ayırt etmek için uzman tarafından tasarlanan modellerde, sırasıyla %100,00 ve %99,00 duyarlılık ve %99,00 ve %100,00 özgüllük sağlanmıştır.
Yaş ve kuru YBMD’yi birbirinden ayırmak için tasarlanan AutoML Model III, normal OKT görüntülerinden yaş (doğruluk: %93,00) ve kuru YBMD’yi (doğruluk: %90,50) ayrı ayrı tanıyan modellere kıyasla daha düşük performans göstererek %86,00 doğruluk göstermiştir. Buna karşılık, uzman tarafından tasarlanan Model III, mükemmele yakın performansa göstererek %99,50 doğruluk sergilemiştir. Tüm modellerin performans metrikleri Tablo 2’de özetlenmiştir.
Normal OKT görüntülerine kıyasla tüm patolojik görüntüleri tanıyan AutoML Model IV, 0,88 ağırlıklı F1 skoru ile %89,00 doğruluk gösterdi. Buna karşılık, uzman tarafından tasarlanan Model IV modeli %99,67 doğruluk ve 0,97 ağırlıklı F1 puanı elde etti. Hem AutoML hem de uzman tarafından tasarlanan Model IV için karışıklık matrisleri Şekil 1’de gösterilmiştir.
Tartışma
EfficientNet V2’nin kullanıldığı uzman tarafından tasarlanan modeller ile ResNet-50 V2 ile transfer öğrenmeyi kullanan AutoML modellerinin karşılaştırılmalı analizi, performanstaki önemli farklılıkları ortaya koymuş ve uzman mühendislerin özel tıbbi görüntüleme görevlerindeki kritik rolünün altını çizmiştir. Uzman tarafından geliştirilen model, tüm OKT veritabanında YBMD’yi tespit etmek gibi en karmaşık görevde, tüm sınıflarda 0,99 veya daha yüksek F1 puanları ile %99,67’lik olağanüstü bir doğruluk oranı elde etmiştir. Bu yüksek performans seviyesi, modelin yalnızca pozitif tahminlerinde doğru olmadığını, aynı zamanda OKT görüntülerinde neredeyse tüm ilgili YBMD’leri belirlemede de etkili olduğunu göstermektedir. Minimum yanlış sınıflandırma oranları, hastalık tanısı ve tedavi planlaması için hassas sınıflandırmanın çok önemli olduğu klinik uygulamalarda modelin güvenilirliğini güçlendirmektedir. Buna karşılık, AutoML modeli, ikili sınıflandırmalarda 0,8725 ile 0,9045 arasında değişen F1 puanları ile daha düşük bir oran olan %89,00’lık bir genel doğruluk göstermiştir. YBMD’nin hatalı tanısı veya tanıda geç kalınması progresif görme kaybına yol açabileceğinden ve tedavi sonuçlarını etkileyebileceğinden, bu yetersizliğin önemli klinik sonuçları olabilir.
Uzman tarafından geliştirilen modelin daha üstün performans göstermesi birkaç temel faktöre bağlanabilir. Öncelikle, EfficientNet V2’nin gelişmiş mimarisi, ağ derinliğini, genişliğini ve çözünürlüğünü eşzamanlı olarak ölçeklendiren ve OKT görüntülerinde karmaşık desenleri daha etkili bir şekilde yakalamasını sağlayan bir bileşik ölçeklendirme yöntemi kullanmaktadır.21 Bu özellik, YBMD sınıfları arasındaki küçük farklılıkları ayırt etmek için çok önemlidir. EfficientNet V2’de ayrıca kanal dikkat mekanizmaları da bulunmaktadır ve bu sayede model daha az alakalı olan kanalları baskılarken en bilgilendirici kanallara seçici olarak odaklanır. Bu stratejik dikkat, model doğruluğunun artmasına katkıda bulunarak özellik temsilini iyileştirir. Çalışmamıza benzer şekilde Kansal ve ark.23 tarafından yakın zamanda yapılan bir çalışmada, bu iki CNN algoritması olan ResNet-50 ve EfficientNetB0’ın koronavirüs hastalığı-2019 (COVID-19), bakteriyel ve viral pnömoni ve normal olgulardan oluşan akciğer röntgeni veri setleri üzerindeki performansı değerlendirilmiştir. Sonuçlara göre EfficientNetB0 performansının daha üstün olduğu görülmüş ve 0,98 eğitim doğruluğu ve 0,99 test doğruluğu elde edilmiştir. Buna karşılık, ResNet-50 modeli ile eğitim doğruluğu 0,83 ve test doğruluğu ise 0,96 bulunmuştur. Bu sonuçlar EfficientNetB0’ın bu bağlamda daha etkin olduğuna işaret etmektedir. De La Fuente ve ark.24 tarafından yapılan bir çalışmada, sentetik görüntülerle desteklenmiş özofagogastroduodenoskopi görüntülerinden oluşan küçük, dengesiz bir veri seti üç kategoride sınıflandırılmış ve iki DÖ modelinin sınıflandırma performansı değerlendirilmiştir. Sonuçlar, EfficientNet V2 ile elde edilen genel doğruluk oranının %92,19 ve genel F1 skorunun ise 91,03 olduğunu göstermiştir. Buna karşılık, ResNet-50 algoritması ile elde edilen genel doğruluk oranı %89,49 ve genel F1 skoru 88,74 olmuştur. Bu bulgular, görüntü sınıflandırma görevlerinde EfficientNet’in daha üstün bir performans gösterdiğine işaret etmektedir.
Özelleştirilmiş ön işleme ve veri artırma, bir modelin ML çalışmalarında genelleme yapma yeteneğini önemli ölçüde artırır. Lobe uygulaması her görüntünün beş rastgele varyasyonunu oluştururken, uzman modeller daha hedefli ve çeşitli artırma tekniklerinden yararlanabilir. Ayrıca çalışmamızda Optuna aracılığıyla öğrenme oranı, bırakma oranı ve ağırlık azalması gibi parametreler doğrulama hassasiyetini en üst düzeye çıkarmak için titizlikle ayarlanmıştır. Bu da uzman tarafından geliştirilen modellerde genelleme ve model performansı iyileştirilmiştir.22 Bu bulgu, akciğer bilgisayarlı tomografi görüntülerinden COVID-19 pnömonisi tanısında CNN modelinin duyarlılığını 0,94’ten 0,97’ye ve doğruluğunu 0,87’den 0,88’e çıkardığını gösteren Lacerda ve ark.25 çalışmasında olduğu gibi Optuna yazılım çerçevesi ile hiperparametre optimizasyonunu yapılmasını destekler niteliktedir. Buna karşılık, LobeAI model optimizasyonu için belirli hiperparametrelerde ince ayar yapılmasına izin vermeden standart ayarlar yapılmasına izin vermektedir. Bu da karmaşık sınıflandırma görevlerinde performansı sınırlamış olabilir.
Hem AutoML hem de uzman tarafından geliştirilen modellerin yaş YBMD’yi normal olgulardan ayırmada kuru YBMD’yi normal olgulardan ayırmaya kıyasla daha başarılı olduğunu gözlemledik. Bu bulgu literatürle uyumludur ve yaş YBMD’nin fenotipik özelliklerinin (koroidal neovaskülarizasyon, intraretinal kistler ve subretinal sıvı) daha belirgin ve güçlü olduğunu göstermektedir. Bu nedenle görüntüleme tabanlı modellerle sınıflandırılması daha kolaydır.26 Klinik açıdan, yaş YBMD sınıflandırmasının yüksek doğruluk ile yapılıyor olması bir avantajdır, çünkü bu alt tipin erken ve doğru tanısı, ciddi görme kaybını önleyebilen zamanında müdahale için çok önemlidir. Ayrıca, beklediğimiz gibi, yaş YBMD’yi kuru tipten ayırarak sınıflandırma başarısı, normal ile herhangi bir tip YBMD’yi birbirinden ayırmaya kıyasla daha düşük olmuştur. Bu, üst üste binen özelliklerden ve kuru ve yaş YBMD arasındaki çok küçük farklılıklardan kaynaklanabilir. Bu nedenle otomatik bir sistemin iki alt türü karıştırmadan güvenilir bir şekilde ayırt etmesi zor olabilir.2
Tüm patolojik görüntüler ile normal OKT görüntülerini birbirinden ayırarak sınıflandıran AutoML Model IV’nin doğruluk düzeyi %89,00 ve ağırlıklı F1 skoru 0,88 bulunmuştur. Bu değerler patolojik ve normalin birbirinden ayrımı için makul değerlerken, uzman tarafından tasarlanan model yaklaşık mükemmel sonuç vermiş ve doğruluk oranı %99,67 ve ağırlıklı F1 skoru 0,97 bulunmuştur. AutoML modelinin ResNet-50 V2 ve genel ön işleme adımlarına dayalı bir model olması, tıbbi görüntü analizi gibi özel alanlardaki etkinliğini sınırlayabilir. ResNet-50 V2, güçlü olsa da, OKT görüntülerinde ince detayları EfficientNetV2 kadar verimli bir şekilde yakalayamayabilir. Ayrıca, AutoML platformları genellikle bazı görevler için en uygun olmayabilecek varsayılan ayarlar kullanmaktadır, bu da mimarinin suboptimal olmasına ve hiperparametre ayarlamasının yetersiz kalmasına yol açar. Bu bulgular, uzman mühendisler tarafından geliştirilen modellerin, özellikle yüksek hassasiyet gerektiren karmaşık görevlerde, yalnızca AutoML platformları aracılığıyla üretilenler modellerden daha iyi performans gösterebileceğini düşündürmektedir.
Çalışmanın Kısıtlılıkları
Bu umut verici sonuçlara rağmen, bazı kısıtlılıklar olduğu vurgulanmalıdır. Veri kümesi, bu çalışma için yeterli olsa da, daha geniş hasta popülasyonlarında bulunan değişkenliği tam olarak yansıtmayabilir. Gelecekteki araştırmalar, modellerin genellenebilirliğini geliştirmek için daha büyük ve daha çeşitli veri kümeleri ile yapılmalıdır. Ayrıca, Google Vertex AI, Microsoft Azure AutoML ve Amazon SageMaker gibi daha yeni AutoML platformları, kodlama deneyimi olmayan kullanıcıların parametreleri optimize etmelerini sağlayarak performansı artırabilir.27 Bununla birlikte, bu platformlarda modelleme için deneme limitleri vardır ve limit aşıldığında ödeme yapılması gerekir.
Sonuç
Bu çalışma, OKT görüntüleri ile YBMD’nin sınıflandırılması için AutoML ve uzman tarafından geliştirilen ML modellerinin bir karşılaştırmasını sunmaktadır. Bulgularımız, Lobe AI AutoML platformunun klinisyenlerin ML modelleri geliştirmesi için uygun bir yol olduğunu ancak uzman girdilerinin özel görevlerde performansı optimize etmek için çok önemli olduğunu göstermektedir. Uzman tarafından tasarlanan EfficientNet V2 modeli doğruluk ve hassasiyet açısından üstündü. Bu, gelişmiş mimarilerin, özelleştirilmiş veri artırmanın ve hiperparametrelerde ince ayarlar ile optimizasyon yapılmasının değerini göstermektedir. AutoML’nin kolay erişilebilirliği ile uzman mühendisliği bir araya getirmek, klinisyenler için kullanımın kolay olmasını sağlarken model performansını daha da artırabilir. Mühendisler ve sağlık uzmanları arasında yapılacak işbirlikleri, hem etkili hem de klinik olarak kullanılabilir yapay zeka çözümleri geliştirmek ve nihayetinde hasta bakımının iyileştirilmesine katkıda bulunmak için gereklidir.