تم تصميم فيديو الذكاء الاصطناعي لفيديو Avataar، وهو أرخص وأسرع وواعي ثقافيًا، ليناسب نطاق الهند

مشاركة:
وقت القراءة: 1 دقيقة

كان إنتاج نموذج الذكاء الاصطناعي في الهند بطيئا مقارنة بالولايات المتحدة وأوروبا والصين. يقوم عدد قليل فقط من الشركات الناشئة بإصدار نماذج، ومعظمها عبارة عن نماذج لغوية كبيرة أو نماذج صوتية. لتشجيع المزيد من التطوير، أطلقت الحكومة مبادرة بقيمة 1.2 مليار دولار تقريبًا والتي – من بين أمور أخرى – تمنح الشركات الناشئة المختارة إمكانية الوصول إلى حوسبة GPU المدعومة مقابل إطلاق نماذجها علنًا. أطلقت إحدى الشركات الناشئة الـ 12 التي تم اختيارها للبرنامج، نموذج فيديو جديدًا يسمى Varya تم تصميمه لفهم السياق المحلي – مثل تحديد المهرجانات المختلفة والطعام والملابس.

الشركة الناشئة المدعومة من Peak XV، والتي تركز على لعبة Varya، لم تقم ببناء Varya من الصفر. لقد بدأ الأمر بـ Wan 2.2، وهو نموذج توليد فيديو متاح للعامة أصدرته شركة Alibaba، واستخدم تقنية تسمى التقطير – حيث تم بشكل أساسي ضغط قدرات النموذج في إصدار أصغر حجمًا وأسرع تم تحسينه لحالات الاستخدام المحددة لـ Avataar. والنتيجة هي نموذج يتم تشغيله في أربع خطوات بدلاً من 50 لـ Wan 2.2، مما ينتج فيديو أسرع بعشر مرات وبجزء بسيط من التكلفة.

ولتوضيح ذلك بشكل ملموس: باستخدام وحدة معالجة الرسومات NVIDIA H200، يمكن لـ Varya إنشاء مقطع مدته 5 ثوانٍ بدقة 720 بكسل في 45 ثانية، مقارنة بـ 1230 ثانية لـ Wan 2.2.

قد يكون الجانب الأكثر لفتًا للانتباه في Varya هو سعره. تخطط الشركة لتحصيل 0.48 روبية هندية (0.005 دولار أمريكي) في الثانية من الفيديو على خدمتها المستضافة – وهي أرخص بكثير من الموديلات مثل Veo وKling وLuma وRunway، والتي تتقاضى عادةً 0.10 دولار أمريكي أو أكثر في الثانية. هذا فرق سعر 20x تقريبًا.

“الهند هي سوق الفيديو أولاً. ونحن نرى ذلك عبر كل منتج كبير من منتجات الإنترنت الاستهلاكية في الهند: الفيديو يتفوق على النص. نماذج فيديو الذكاء الاصطناعي الحالية باهظة الثمن للغاية بالنسبة للاستخدام على نطاق السكان في الهند. إذا كان الذكاء الاصطناعي للفيديو سيصل إلى الطلاب والمعلمين والشركات الصغيرة والمتوسطة والمبدعين والمؤسسات والخدمات العامة، فيجب أن تنخفض التكاليف بشكل كبير. وقال راجان أناندان، المدير الإداري لشركة Peak XV، لـ TechCrunch: “إن التكلفة هي أكبر وسيلة لاعتماد الذكاء الاصطناعي في الهند”.

غالبًا ما تفتقد نماذج توليد الصور والفيديو الفروق الثقافية الدقيقة وتنتج مخرجات نمطية أو عامة – وهي مشكلة تواجهها TechCrunch. تقول Avataar AI إنها استخدمت بيانات منسقة لتدريب Varya على التعرف على الفروق الثقافية الدقيقة بما في ذلك الطعام والملابس والهندسة المعمارية والمهرجانات.

سيتم إصدار Varya كنموذج مفتوح الوزن على – المستودع المركزي للحكومة الهندية لنماذج الذكاء الاصطناعي ومجموعات البيانات المتاحة للجمهور – إلى جانب بيانات التدريب الخاصة به، مما يعني أنه يمكن للمطورين استضافتها ذاتيًا أو تعديلها وفقًا لاحتياجاتهم الخاصة. تخطط Avataar أيضًا لإتاحة النموذج لعملائها من المؤسسات وتقول إنها مفتوحة للشراكات مع أدوات الفيديو بما في ذلك Higgsfield وAdobe Firefly. يمكن لأي شخص تجربته الآن على موقعه على الويب باستخدام المطالبات النصية أو الصور المرجعية.

ويعكس إطلاق فاريا مقايضة أساسية في طموحات الهند في مجال الذكاء الاصطناعي. وقد لاحظ خبراء الصناعة أن الهند يمكن أن تترك بصمتها في مجال الذكاء الاصطناعي من خلال النماذج الأساسية القوية بدلاً من التنافس عليها. وهناك سبب لهذه البراغماتية: كان تطوير النموذج في الهند أبطأ منه في المنافسين العالميين بسبب محدودية توافر البيانات عالية الجودة.

تعد مهمة الذكاء الاصطناعي في الهند أيضًا جزءًا من حملة حكومية أوسع لسد هذه الفجوة. وفي العام الماضي، اختارت 12 شركة ناشئة – من بينها Avataar AI – لتطوير نماذج الذكاء الاصطناعي وتزويدها بحوسبة فعالة من حيث التكلفة. وفي وقت سابق من هذا العام، قال وزير تكنولوجيا المعلومات أشويني فايشناو إن الهند تهدف إلى جذب استثمارات في الذكاء الاصطناعي بحلول عام 2028 وأكثر من قدرتها على معالجة الرسوميات في غضون ستة أشهر.

عندما تقوم بالشراء من خلال الروابط الموجودة في مقالاتنا، . هذا لا يؤثر على استقلالنا التحريري.

مشاركة: