Bir sabah göğsünüzde tarif edemediğiniz bir sıkışma hissediyorsunuz. Eskiden refleks Google’a yazmaktı; bugün giderek daha fazla insan doğrudan ChatGPT’ye dönüyor ve “şu belirtilerim var, nem var?” diye soruyor. Yanıt akıcı, kendinden emin, hatta empatik bir dille geliyor. Peki bu yanıta ne kadar güvenebiliriz? Büyük dil modeli dediğimiz bu sistemler gerçekten teşhis koyabilir mi, yoksa sadece teşhis koyuyormuş gibi mi yapıyor?

Bu yazı, yapay zekânın tıbbi teşhisteki rolünü ele alan dosyamızın bir parçası. Burada özellikle metin tabanlı genel amaçlı modellerin (ChatGPT, Gemini, Claude gibi) klinik gücüne ve sınırlarına yakından bakıyoruz.

Büyük dil modeli tam olarak ne yapıyor?

GPT, Gemini, Claude ve benzerleri, internet ölçeğinde devasa metin yığınlarıyla eğitilmiş istatistiksel makinelerdir. Tek yaptıkları, verilen bir metnin ardından gelmesi en olası kelimeyi tahmin etmek. Kulağa basit geliyor, ama bu tahmin yeteneği yeterince büyük bir ölçeğe ulaştığında ortaya tıp ders kitaplarını, vaka raporlarını ve hasta forumlarını “okumuş” gibi davranan bir sistem çıkıyor.

Kritik nokta şu: model hastalığı anlamaz, fizyolojiyi kavramaz. Sadece tıp metinlerinde hangi kelimelerin hangi kelimelerle birlikte geçtiğini öğrenmiştir. “Ateş, öksürük, nefes darlığı” üçlüsünün ardından “pnömoni” kelimesinin gelme olasılığı yüksek olduğu için bunu yazar. Bu bazen şaşırtıcı derecede isabetli, bazen de tehlikeli derecede yanıltıcı bir sonuç doğurur.

Tıp sınavlarındaki şaşırtıcı başarı

Yapay zeka sohbet uygulaması
Yapay zeka sohbet uygulaması

Modellerin tıbbi bilgiyi ne kadar içselleştirdiğini ölçmenin en somut yolu, hekimlerin girdiği sınavlara sokmak oldu. ChatGPT, ABD’de hekimlik lisansı için gereken USMLE sınavının geçme barajını aştığında bu, tıp dünyasında ciddi yankı uyandırdı. Bir dil modeli, yıllarca çalışan tıp öğrencilerinin zorlandığı bir sınavı geçebiliyordu.

Dar uzmanlık alanlarında da tablo dikkat çekici. Dermatoloji vakaları üzerine yapılan değerlendirmelerde modeller, yazılı vaka tanımları üzerinden yaklaşık dörtte üç oranında doğru tanıya ulaşabiliyor. Kardiyoloji senaryolarında da benzer şekilde, klinik bilgi sorularını ve vaka muhakemelerini önemli ölçüde doğru yanıtladıkları gösterildi.

Ama burada bir tuzak var. Sınav sorusu zaten temizlenmiş, düzenlenmiş, ilgili bilgileri özenle içine yerleştirilmiş bir metindir. Gerçek hasta ise dağınık, çelişkili, eksik anlatır. “Karnım ağrıyor” diyen bir kişinin arkasında apandisit de olabilir, kaygı bozukluğu da, kalp krizi de. Sınavda parlamak ile muayenehanede doğru karar vermek aynı şey değil.

Modelin gerçekten iyi olduğu yerler

Hakkını verelim: dil modelleri bazı işlerde gerçekten değerli. Hekimin yorucu hasta görüşmesi sonrası tuttuğu dağınık notları derli toplu bir epikrize çevirmek, karmaşık bir tıbbi raporu hastanın anlayacağı sade bir dile tercüme etmek, uzun bir literatürü özetlemek gibi görevlerde hız ve tutarlılık sağlıyorlar.

Hasta iletişiminde de potansiyel var. Bazı çalışmalar, modellerin hastaların sorularına yorulmadan, sabırla ve nazik bir tonda yanıt verdiğini gösterdi. Bir doktor günde yüzüncü kez aynı soruyu sabırla yanıtlamakta zorlanabilir; model için yüzüncü soru da birincisi gibidir. Bu, özellikle bilgilendirme ve hatırlatma süreçlerinde işe yarayabilir.

Dikkat edin: bu örneklerin hepsi destekleyici görevler. Not yazımı, özetleme, tercüme. Hiçbiri “şu hastaya şu tanıyı koy ve şu ilacı ver” değil. Aradaki çizgi tam olarak burada.

Halüsinasyon: en sinsi risk

Yapay zeka ve sağlık
Yapay zeka ve sağlık

Büyük dil modellerinin en tehlikeli özelliği, bilmediğini bilmemesidir. Model bir cevabı bilmediğinde “bilmiyorum” demek yerine, son derece inandırıcı bir yalan üretebilir. Buna halüsinasyon (yapay zeka) deniyor. Var olmayan bir ilaç dozu, gerçek olmayan bir bilimsel makale, uydurma bir DOI numarası ya da hiç var olmamış bir tedavi kılavuzu uydurabilir.

Tıpta bunun bedeli ağır. Bir hastanın belirtilerini girip “merak etme, bu sadece kas ağrısı” yanıtı almak ile gerçekte bir kalp krizinin habercisi olan bir bulguyu atlamak arasındaki fark, hayat ile ölüm olabilir. Daha da kötüsü, model yanlış olduğunda da doğru olduğundaki kadar kendinden emin konuşur. Yanlış cevabın yüzünde bir tereddüt belirtisi yoktur.

Göremediği, dokunamadığı, isteyemediği şeyler

Bir hekimin teşhisi yalnızca kelimelerden ibaret değildir. Doktor hastanın yüzündeki rengi, cildin dokusunu, nefesindeki kokuyu, karnına bastığında verdiği tepkiyi, gözlerindeki sararmayı algılar. Stetoskopla dinler, kan tahlili ister, görüntüleme yaptırır. Dil modeli bunların hiçbirini yapamaz. Yalnızca size yazdığınız kadarını bilir.

Bağlam eksikliği de büyük sorun. Model sizin geçmiş hastalıklarınızı, kullandığınız ilaçları, ailenizdeki genetik yükü, son aylardaki yaşam değişikliklerinizi bilmez (siz tek tek yazmadıkça). Oysa aynı belirti, farklı geçmişe sahip iki kişide tamamen farklı anlamlar taşır.

Bir de güncellik problemi var. Modeller belirli bir tarihe kadarki verilerle eğitilir. Yeni çıkan bir ilaç, değişen bir tedavi kılavuzu ya da güncel bir salgın bilgisi modelin bilgi havuzunda olmayabilir. Hekim güncel literatürü takip eder; model çoğu zaman dünden konuşur.

Veri gizliliği: yazdığınız nereye gidiyor?

Sağlık verisi en hassas kişisel veri kategorisindedir. ChatGPT’ye tahlil sonuçlarınızı, hastalık geçmişinizi, hatta kimlik bilgilerinizi yazdığınızda bu bilgiler genellikle bir sunucuya gönderilir ve duruma göre modelin geliştirilmesinde kullanılabilir. Hekiminizle aranızdaki sır saklama yükümlülüğü, ticari bir sohbet robotunda aynı şekilde geçerli değildir.

Bu yalnızca bireysel bir risk de değil. Hastanelerin bu araçları hasta verisiyle kullanması, KVKK ve uluslararası veri koruma düzenlemeleri açısından ciddi sorumluluklar doğuruyor. Verinin nerede saklandığı, kimin eriştiği ve nasıl korunduğu hayati sorular.

“Dr. Google”dan farkı ve neden daha riskli

Yıllardır insanlar belirtilerini Google’a yazıp kendilerine tanı koyuyor. “Dr. Google” deyimi de buradan çıktı. Arama motoru size bir liste verir; içinde güvenilir sağlık siteleri de olur, abartılı korku içerikleri de. En azından kaynağı görür, birden fazla görüşü tartabilirsiniz.

Dil modeli ise tek bir kesin, akıcı, ikna edici cevap verir. İşte bu yüzden daha tehlikeli. Bir liste size “burada belirsizlik var, araştır” mesajı verirken, kendinden emin bir paragraf “cevap budur” hissi yaratır. İnsan beyni, otoriter ve akıcı anlatıma daha kolay teslim olur. Yanlış bir tanıya “evet, bu kesin” diye onay almak, belirsiz bir arama sonucundan çok daha kolay yanlış karara sürükler.

Hastanın doğrudan modele teşhis sorması iki yönlü zarar verebilir. Birincisi, gereksiz panik: model en kötü ihtimali sıralayınca kişi olmadık korkulara kapılır. İkincisi, sahte rahatlama: model “önemli değil” deyince gerçekten önemli bir belirti görmezden gelinebilir ve doktora gitmek geciktirilebilir. İkincisi çoğu zaman daha ölümcüldür.

Peki ya görüntü tabanlı yapay zekâlar?

Genel amaçlı sohbet modellerinden ayrı olarak, tek bir göreve özel eğitilmiş tıbbi yapay zekâlar var ve bunlar çok daha güvenilir. Örneğin cilt kanserini görüntüden tarayan dermatoloji algoritmaları ya da yoğun bakımda sepsisi erken yakalayan erken uyarı sistemleri, dar bir alanda klinik verilerle eğitildikleri ve doğrulukları titizce ölçüldüğü için ChatGPT’den apayrı bir kategoridir. Genel bir sohbet robotuyla, FDA onayı almış özel bir teşhis cihazını karıştırmamak gerekir.

Hekimin yerini alır mı? Net cevap

Hayır. Bugünkü hâliyle de, öngörülebilir gelecekte de büyük dil modelleri hekimin yerini almaz. Çünkü teşhis bilgi ezberinden ibaret değildir; muayene, sezgi, sorumluluk, bağlam ve insan ilişkisi gerektirir. Bir model yanlış tanı koyup zarar verdiğinde sorumluluk kimde? Hekim diplomasının ve mesleki sorumluluğunun ağırlığını bir yazılım taşıyamaz.

Doğru çerçeve şu: dil modeli, hekimin elindeki bir araçtır. Notunu yazar, raporunu özetler, akla gelmeyen bir olasılığı hatırlatır, hastayla iletişimde yardımcı olur. Ama son sözü, gözüyle gören, eliyle muayene eden ve sorumluluğu üstlenen insan söyler. Hastanın yapması gereken de değişmez: kendinizi bir sohbet robotuna teşhis ettirmeyin, doktora gidin. ChatGPT’yi bilgilenmek için kullanabilirsiniz, ama tanı ve tedavi kararını ona bırakmayın.

📚 Kaynaklar

Teknoloji editörü. Yapay zeka, mobil cihazlar, elektrikli araçlar ve dijital dönüşüm konularında yazıyor. İçerikleri, üretici teknik dokümanları, ürün incelemeleri ve sektör analizleri temel alınarak hazırlanır. Kullanıcı odaklı, anlaşılır ve karşılaştırmalı içerikler üretmeyi hedefler.

📤 Paylaş:𝕏 Paylaşf Paylaş💬 WhatsAppin Paylaş

By Mert Şahin

Teknoloji editörü. Yapay zeka, mobil cihazlar, elektrikli araçlar ve dijital dönüşüm konularında yazıyor. İçerikleri, üretici teknik dokümanları, ürün incelemeleri ve sektör analizleri temel alınarak hazırlanır. Kullanıcı odaklı, anlaşılır ve karşılaştırmalı içerikler üretmeyi hedefler.