24.04.2026 22:27
2026 Mart ayında, telekom müşterilerinin churn oranlarını tahmin etmeye odaklanan bir Kaggle Playground yarışmasında en üst sırayı alan bir ekip, üretici yapay zeka ajanlarını kullandı. Üç gelişmiş büyük dil modeli—GPT-5.4 Pro, Gemini 3.1 Pro ve Claude Opus 4.6—ile donatılmış bu grup, altı yüz bin satırın üzerinde kod üretti, sekiz yüz elli ayrı deney çalıştırdı ve zaferin peşinden gitmek için yüz elli farklı makine öğrenimi modelinden oluşan dört katmanlı bir yığın topluluğu oluşturdu.
Karar verici avantaj, veri bilimi iş akışının dramatik hızlanmasıydı. Geleneksel olarak iki aşama ilerlemeyi engeller: yeni fikirler için yeni kod yazmak ve bu deneyleri aslında çalıştırmak. GPU hızlandırması uzun zamandır yürütme darboğazıyla başa çıkmış olsa da, bu yapay zeka ajanları artık kodlama engelini ortadan kaldırıyor, araştırmacıların benzersiz bir hızda prototipleme ve yineleme yapmalarını sağlıyor. Daha hızlı kodlama ve daha hızlı yürütme, rekabetçi analizler için devrim yaratıyor.
### Üretici Ajanların Oyunu Yeniden Yazması
Yarışmacılardan churn olasılığını tahmin etmeleri ve ara sonuç çemberi (AUC) metriği ile değerlendirilmesi istendi. Kazanan ekip, disiplinli, LLM (Büyük Dil Modeli) odaklı bir boru hattı izledi:
1. **Keşifsel Veri Analizi (EDA)** – Ajanlar ham veri kümelerini ayrıştırdı, otomatik olarak temel tahmincileri belirledi, eksik değerleri vurguladı ve hedef değişkeni doğruladı. Başarılı bir kod çalıştırmadan sonra ardı ardına Python betikleri yazıp çalıştırdılar ve her çalıştırmadan sonra içgörüleri geliştirdiler.
2. **Temel Model Geliştirme** – Bir sonraki aşamada, LLM'ler klasik teknikler olan XGBoost ve modern mimariler olan sinir ağları gibi ilk model kodları üretti. Bu temel modeller, sonraki ayarlamalar için bir performans referansı sağladı.
3. **Özellik Mühendisliği** – Ajanlar çok sayıda dönüşüm ve optimizasyonla denedi, en bilgilendirici özellikler ortaya çıkana kadar sürekli olarak her varyasyonu yineledi. Bu aşama büyük ölçüde otomatikleştirildi ve insan çabasını daha üst düzey kararlar için serbest bıraktı.
4. **Model Yığınlama** – Çeşitli deneylerden elde edilen sonuçlar, derin, çok katmanlı bir yığına toplanan güçlü bir ensemble'a dönüştürüldü. Çeşitli modellerin güçlü yönlerini birleştirerek, son yığın tahmin doğruluğunu maksimize etti.
Tekrarlayan görevlerin—betik oluşturma, parametre taramaları ve sonuç birleştirme—otomasyonu sayesinde ekip, manuel kodlama ile imkansız olacaktı bir hız ve ölçek düzeyi elde etti. Hızlı kod oluşturmanın, GPU destekli yürütmenin ve gelişmiş ensemble stratejilerinin birleşimi, rekabetçi veri bilimi iş akışları için yeni bir standart belirledi.
