Yapay zeka devi OpenAI, ChatGPT ve API'ler için geliştirdiği yeni nesil görsel oluşturma ve düzenleme modeli GPT Image 1.5'i resmen duyurdu.
Sohbet İçinde Birleşik Görsel Deneyimi
OpenAI, ChatGPT içinde kullanıcıların görselleri doğrudan sohbet arayüzünden oluşturup düzenleyebileceği yeni nesil görsel yeteneklerini kullanıma sundu. Eski görsel araçlarının yerini alan bu güncelleme, 'birleşik görseller deneyimi' (unified Images experience) olarak adlandırılıyor. Yeni sistem, daha yüksek sadakat, kullanıcı istemlerine daha güçlü bağlılık ve metin iş akışlarıyla çok daha sıkı bir entegrasyon sunuyor. Hem web hem de mobil platformlarda erişilebilir olan bu özellikler, öncelikli olarak ücretli plan kullanıcılarına sunulmaya başlandı ve kademeli olarak ücretsiz kullanıcılara da genişletilecek.
Gelişmiş Düzenleme ve Analiz Yeteneği
Geliştiricilerin de Images API aracılığıyla erişebileceği bu yeni yetenekler, kullanım alanını önemli ölçüde genişletiyor. Sistem, kullanıcıların sadece metin komutlarıyla görsel oluşturmasına değil, aynı zamanda sohbet yoluyla bu görselleri yineleyerek iyileştirmesine olanak tanıyor. Kullanıcılar, ChatGPT arayüzünden ayrılmadan iç boyama (inpainting), arka plan değişikliği veya nesne değiştirme gibi hassas düzenlemeleri gerçekleştirebiliyor. Ayrıca güncellemenin bir parçası olan görsel anlama özelliği sayesinde, kullanıcılar fotoğraf veya ekran görüntüsü yükleyerek yapay zekadan bunları analiz etmesini, tanımlamasını veya dönüştürmesini talep edebiliyor.
Metin Yazımı ve Görsel Tutarlılık Sorunu Çözüldü
OpenAI, bu hamleyi görselleri sohbete eklenen yan bir özellik olmaktan çıkarıp, çok modlu iş akışlarında birinci sınıf bir girdi ve çıktı olarak konumlandırma stratejisinin bir parçası olarak görüyor. Arka planda çalışan yeni görüntü modeli, birden fazla üretim denemesinde tutarlılığı korumak, görsel içindeki metinleri daha düzgün oluşturmak ve stil ile kompozisyon üzerinde daha güvenilir kontrol sağlamak üzere optimize edildi. Bu iyileştirmeler sayesinde, yapay zeka görsellerinde sıkça karşılaşılan bozuk tipografi (yazı) ve görsel kaymalar gibi kronik sorunların önüne geçilmesi hedefleniyor.
Yaratıcılar ve Pazarlamacılar İçin Hızlı Prototipleme
Yeni model, GPT metin modelleriyle senkronize çalışacak şekilde tasarlandı. Bu entegrasyon, kullanıcıların fikir aşamasından nihai görsel çıktıya kadar olan süreci tek bir oturumda tamamlamasına imkan tanıyor. Özellikle hızlı görsel prototiplemeye ihtiyaç duyan yaratıcılar, pazarlamacılar, eğitimciler ve ürün geliştirme ekipleri bu güncellemenin ana hedef kitlesi arasında yer alıyor. Şirket, önceki görsel araçlarında bulunan içerik filtreleme ve kullanım politikaları gibi güvenlik kontrollerini bu sürümde de koruduğunu vurgularken, teknolojiyi çok modlu sistemler (multimodal) vizyonunun bir parçası olarak yaygınlaştırmayı sürdürüyor.
OpenAI



