Teknoloji dünyasının önde gelen şirketlerinden Google, görsel içerik üretiminde çığır açacak yeni bir yapay zeka teknolojisini duyurdu. Şirketin geliştirdiği Whisk adlı yenilikçi araç, yazılı komutlar yerine görsel girdiyle çalışıyor. Bu sistemde kullanıcılar, istedikleri sonucu elde etmek için birden çok görsel öğeyi sisteme yükleyebilecek.
Google, şu anda deneysel olan Whisk adlı başka bir üretken yapay zeka aracıyla ayrıntılı metin istemleri yerine girdi olarak görüntü göndermenize ve karşılığında yeniden düzenlenmiş bir görüntü almanıza olanak tanıyor. Araçta konu, stil ve sahne gibi çeşitli yönler için birden fazla görüntü girebiliyorsunuz. Whisk daha sonra Gemini’yi kullanarak arka planda bir metin istemi oluşturuyor ve bunu Google’ın görüntü oluşturma modeli Imagen 3‘e iletiyor.
Imagen 3 teknolojisinden güç alan Whisk, gerçek dünya unsurlarını ve sinematik öğeleri başarıyla yorumlayarak gerçekçi görüntüler oluşturmayı hedefliyor. Google'ın "hızlı görsel fikir üretme" aracı olarak tanımladığı sistem, çıktıların daha da geliştirilebileceğini öngörüyor.
Kullanıcılar, sistemin ürettiği görüntülerde değişiklik yapabilme imkanına sahip olacak. Bunun yanı sıra Google, Veo 2 isimli gelişmiş video üretim modelini de tanıttı. Bu yeni model sadece içerik üretmiyor; aynı zamanda anlık analiz yapabilen ve öneriler sunabilen kapsamlı bir sistem olarak öne çıkıyor.
Bu teknoloji, uzun videoları saniyeler içinde tarayarak izleyiciler için en çarpıcı bölümleri tespit edebiliyor. Ayrıca çoklu dil desteğiyle altyazı ve dublaj konusunda da yenilikçi çözümler sunarak, içeriklerin global ölçekte erişilebilirliğini artırıyor.
Google'ın bu iki yeni teknolojisi, Whisk'in görüntü üretiminde ve Veo 2'nin video oluşturmada getirdiği yeniliklerle, yapay zeka destekli görsel içerik üretiminde yeni bir dönemin başladığını gösteriyor.
Google, şu anda deneysel olan Whisk adlı başka bir üretken yapay zeka aracıyla ayrıntılı metin istemleri yerine girdi olarak görüntü göndermenize ve karşılığında yeniden düzenlenmiş bir görüntü almanıza olanak tanıyor. Araçta konu, stil ve sahne gibi çeşitli yönler için birden fazla görüntü girebiliyorsunuz. Whisk daha sonra Gemini’yi kullanarak arka planda bir metin istemi oluşturuyor ve bunu Google’ın görüntü oluşturma modeli Imagen 3‘e iletiyor.
Whisk sisteminin çalışma prensibi
Bu yeni teknolojide, kullanıcıların yüklediği görseller, oluşturulacak içeriğin ana hatlarını belirliyor. Sistem metin destekli ek özelleştirmelere izin verse de, temel çalışma mantığı görsel girdilere dayanıyor.Imagen 3 teknolojisinden güç alan Whisk, gerçek dünya unsurlarını ve sinematik öğeleri başarıyla yorumlayarak gerçekçi görüntüler oluşturmayı hedefliyor. Google'ın "hızlı görsel fikir üretme" aracı olarak tanımladığı sistem, çıktıların daha da geliştirilebileceğini öngörüyor.
Kullanıcılar, sistemin ürettiği görüntülerde değişiklik yapabilme imkanına sahip olacak. Bunun yanı sıra Google, Veo 2 isimli gelişmiş video üretim modelini de tanıttı. Bu yeni model sadece içerik üretmiyor; aynı zamanda anlık analiz yapabilen ve öneriler sunabilen kapsamlı bir sistem olarak öne çıkıyor.
Bu teknoloji, uzun videoları saniyeler içinde tarayarak izleyiciler için en çarpıcı bölümleri tespit edebiliyor. Ayrıca çoklu dil desteğiyle altyazı ve dublaj konusunda da yenilikçi çözümler sunarak, içeriklerin global ölçekte erişilebilirliğini artırıyor.
Google'ın bu iki yeni teknolojisi, Whisk'in görüntü üretiminde ve Veo 2'nin video oluşturmada getirdiği yeniliklerle, yapay zeka destekli görsel içerik üretiminde yeni bir dönemin başladığını gösteriyor.