Hindistan, yapay zeka alanında küresel ölçekteki rakiplerine kıyasla geride kaldığı video modellemelerinde iddialı bir adım attı. Yerel bağlamı anlayan, daha hızlı ve çok daha uygun maliyetli bir video yapay zekası modeli olan Varya, duyuruldu.
YEREL KÜLTÜRE HASSAS YAPAY ZEKA
Avataar AI tarafından geliştirilen Varya, Hindistan'ın kültürel zenginliklerini, festivallerini, yemeklerini ve giyim tarzlarını anlayacak şekilde tasarlandı. Bu, küresel yapay zeka modellerinin sıklıkla göz ardı ettiği bir detay olarak öne çıkıyor. Başlangıçta Alibaba'nın Wan 2.2 modelini temel alan Varya, 'distilasyon' tekniğiyle sıkıştırılarak daha verimli hale getirildi. Sonuç olarak, Wan 2.2'nin 50 adımda ürettiği videoyu Varya sadece 4 adımda tamamlayarak, süreyi 10 katına kadar kısaltıyor ve maliyeti dramatik şekilde düşürüyor. Örneğin, 5 saniyelik 720p bir videoyu NVIDIA H200 GPU ile Varya 45 saniyede üretirken, Wan 2.2 bu süreyi 1230 saniyeye çıkarıyor.
MALİYET ENGELİNİ AŞMAK
Peak XV'nin yönetici direktörü Rajan Anandan'ın da altını çizdiği gibi, Hindistan gibi büyük bir nüfusa sahip ülkelerde yapay zeka tabanlı video araçlarının yaygınlaşabilmesi için maliyetlerin düşmesi şart. Varya, saniyede 0.48 Rupi (yaklaşık 0.005 ABD doları) gibi, Veo, Kling, Luma ve Runway gibi popüler modellere göre 20 kat daha ucuz bir fiyatla hizmet vermeyi planlıyor. Bu, Hindistan'da yapay zeka adaptasyonunun önündeki en büyük engelin maliyet olduğunu gösteriyor. Avataar AI, Varya'yı Hindistan Hükümeti'nin yapay zeka modelleri ve veri kümeleri için merkezi deposu olan India AI Kosh portalında açık kaynak olarak yayımlayacak. Bu, geliştiricilerin modeli kendi ihtiyaçlarına göre uyarlamalarına veya barındırmalarına olanak tanıyacak. Ayrıca, kurumsal müşterileri ve Higgsfield, Adobe Firefly gibi video araçlarıyla ortaklıklar da planlanıyor.

