OpenAI, özellikle kodlama, bilgisayar kullanımı, bilgi işleri ve bilimsel araştırma tarafına odaklanan yeni modeli GPT-5.5’i duyurdu. Şirkete göre model, dağınık ve çok adımlı görevlerde daha otonom çalışabiliyor; üstelik gerçek kullanımda GPT-5.4 ile benzer gecikme süresi sunarken aynı Codex görevlerinde daha az token tüketiyor.
Paylaşılan teknik verilere göre GPT-5.5, agentic coding tarafında şimdiye kadarki en güçlü model olarak konumlandırılıyor. Terminal-Bench 2.0’da yüzde 82,7 skor alan model, GPT-5.4’ün yüzde 75,1 seviyesinin üzerine çıkarken; SWE-Bench Pro’da ise yüzde 58,6’ya ulaşıyor. OpenAI ayrıca modelin uzun soluklu kodlama görevlerinde, belirsiz hataları çözmede ve büyük kod tabanlarında değişiklikleri uçtan uca sürdürmede daha başarılı olduğunu söylüyor.
Modelin sadece yazılım geliştirme değil, genel bilgisayar kullanımında da daha yetenekli olduğu belirtiliyor. OpenAI, GPT-5.5’in Codex içinde belge, tablo ve sunum üretiminde GPT-5.4’e göre daha iyi sonuç verdiğini; araçlar arasında geçiş, sonuç kontrolü ve arayüzlerde gezinme gibi konularda da daha güçlü performans sunduğunu aktarıyor. Şirketin verdiği örneğe göre finans ekibi, GPT-5.5 destekli Codex ile 24.771 adet K-1 vergi formunu ve toplam 71.637 sayfayı inceleyerek süreci bir önceki yıla göre iki hafta hızlandırdı.
Araştırma tarafında da dikkat çekici iddialar var. OpenAI, GPT-5.5’in GeneBench’te GPT-5.4’e göre gelişim gösterdiğini ve BixBench’te yüzde 80,5 skor aldığını söylüyor. Ayrıca modelin özel bir dahili sürümünün, daha sonra Lean ile doğrulanan off-diagonal Ramsey sayılarıyla ilgili yeni bir ispatın bulunmasına yardımcı olduğu ifade ediliyor. Şirket, performans artışının bir bölümünü NVIDIA GB200 ve GB300 NVL72 sistemleri üzerinde yapılan altyapı çalışmalarına bağlıyor; buna ek olarak Codex’in üretim trafiğini analiz ederek token üretim hızını yüzde 20’den fazla artıran yeni dengeleme yöntemlerine katkı sağladığı belirtiliyor.
GPT-5.5 ile birlikte güvenlik tarafında da yeni önlemler öne çıkıyor. OpenAI, modelin biyolojik/kimyasal ve siber güvenlik kabiliyetlerini Preparedness Framework kapsamında “High” seviyesinde değerlendirdiğini, ancak “Critical” siber güvenlik seviyesine ulaşmadığını belirtiyor. Model bugün itibarıyla ChatGPT ve Codex içinde Plus, Pro, Business ve Enterprise kullanıcılarına sunulmaya başlanmış durumda; GPT-5.5 Pro ise Pro, Business ve Enterprise kullanıcılarına açılıyor. API tarafına da yakında gelmesi bekleniyor.
Kaynak: iClarified
Kaynak başlığı: OpenAI Launches GPT-5.5 With Major Gains in Agentic Coding and Computer Use


