أخبار

نموذج ذكاء اصطناعي "واقعي بشكل مخيف"

الموناليزا تغني!

الموناليزا في دار المزادات كريستيز في باريس نوفمبر 2021
قرائنا من مستخدمي تلغرام
يمكنكم الآن متابعة آخر الأخبار مجاناً من خلال تطبيق تلغرام
إضغط هنا للإشتراك

إيلاف من لندن: بات بإمكان الموناليزا الغناء! فقد نجح فريق من العلماء في شركة "مايكروسوفت" في تطوير نموذج ذكاء اصطناعي ثوري يُدعى VASA-1، قادر على تحويل أي صورة ثابتة إلى فيديو متحرك مع مزامنة الشفاه وتعبيرات الوجه وحركات الرأس بشكلٍ واقعي مذهل.
تُحاكي المشاعر البشرية
يُمكن لـ VASA-1 تحويل أي صورة ثابتة، سواء أكانت صورة شخصية أو لوحة فنية، إلى فيديو متحرك "ذو تعابير حية" تُحاكي المشاعر البشرية.
وقال الفريق في ورقة بحثية: "لقد قدمنا VASA، وهو إطار عمل لتوليد وجوه ناطقة نابضة بالحياة مع مهارات عاطفية بصرية جذابة (VAS) من خلال صورة ثابتة واحدة ومقطع صوتي للكلام”.
فمثلاً، باستخدام صورة الموناليزا، استطاع العلماء جعلها "تغني" أغنية Paparazzi بصوت آن هاثاواي، مع مزامنة الشفاه وتعبيرات الوجه وحركات الرأس بشكلٍ متقن.

Microsoft acaba de lanzar VASA-1.

Esta IA puede hacer que una sola imagen cante y hable a partir de una referencia de audio de forma expresiva. Similar a EMO de Alibaba

10 ejemplos salvajes ↓

1. Mona Lisa rapeando a Paparazzi pic.twitter.com/74mZH9fTQO

— Adam (@Adamaestr0_) April 19, 2024

إمكانيات واسعة للتفاعلات الرقمية
يُتيح هذا النموذج إمكانيات هائلة للتفاعلات الرقمية في المستقبل، حيث يُمكن استخدامه في إنشاء شخصيات افتراضية نابضة بالحياة للتفاعل مع البشر في مختلف المجالات، مثل التعليم والترفيه وخدمة العملاء. كما يمكن تعزيز التفاعل على وسائل التواصل الاجتماعي من خلال تحويل الصور الثابتة إلى رسوم متحركة تفاعلية.
ويشار إلى أن VASA هو اختصار لـ Visual Affective Skills Animator (بمعنى الرسوم المتحركة للمهارات البصرية العاطفية)، وهو نموذج قادر على تحويل أي صور ثابتة سواء تم التقاطها بواسطة الكاميرا، أو رسمها، إلى رسوم متحركة "متزامنة بشكل رائع".
ويمكن لـ VASA إنشاء فيديو حقيقي "مخيف"، حيث تحاكي "الوجوه الناطقة الواقعية" سلوكيات المحادثة البشرية من خلال إيماءات الوجه وحركة العين والرأس الطبيعية، وكل ذلك من صورة ثابتة واحدة للرأس.
مخاوف انتحال الشخصية
يُثير هذا النموذج مخاوف انتحال الشخصية، خاصةً مع قدرته على جعل أي شخص "يقول" أي شيء.
يُؤكد فريق البحث في "مايكروسوفت" أن هدفهم من الأداة ليس تعزيز التزييف العميق، بل استكشاف إمكانيات التفاعل مع الشخصيات الافتراضية وتوفير الرفقة.
ويُشدد الفريق على ضرورة استخدام هذه التقنية بشكل مسؤول ووفقا للوائح المناسبة، مُؤكدين على اهتمامهم بتطبيقها لتعزيز اكتشاف التزوير.

مستقبل رقمي تفاعلي
تُمثل تقنية VASA-1 خطوة جديدة في مجال الذكاء الاصطناعي، وتُقدم إمكانيات كبيرة للتفاعلات الرقمية في المستقبل.
مع الأخذ بعين الاعتبار مخاوف انتحال الشخصية ومسؤولية الاستخدام، سيكون من المثير للاهتمام مشاهدة كيفية استخدام هذه التقنية في السنوات القادمة.

التعليقات

جميع التعليقات المنشورة تعبر عن رأي كتّابها ولا تعبر بالضرورة عن رأي إيلاف