«مايكروسوفت» تطوّر أداة ذكاء اصطناعي تحوّل الصورة إلى «وجه ناطق»

فريق باحثين في شركة “مايكروسوفت” طوّروا أداة ذكاء اصطناعي تستطيع تحويل صور الوجوه والمقاطع الصوتية إلى فيديوهات تظهر وجوهًا تتكلم بشكل واقعي، وفقًا لوثيقة نشرتها الشركة هذا الأسبوع.
أكدت الشركة أن هدف الأداة ليس لخلق محتوى يهدف للخداع أو التضليل، ولكنها أشارت إلى إمكانية استخدامها لأغراض غير مشروعة، مثل انتحال الهوية.
تثير التطورات السريعة في مجال الذكاء الاصطناعي التوليدي، الذي يتيح إنتاج محتوى متنوع بجودة عالية، مخاوف من الاستخدامات السلبية، مثل الاحتيال والتضليل.
أكدت “مايكروسوفت” أن بحثها يركز على استخدام الصور الرمزية الافتراضية (أفاتار) بشكل إيجابي، وتعارض أي استخدام يهدف لخلق محتوى مضلل أو ضار.
الشركة لا تنوي طرح الأداة الجديدة أو تقديم معلومات تقنية حولها، حيث لم تكن واثقة من أنه سيتم استخدام الأداة بشكل مسؤول وفقًا للقوانين.
البرنامج المسمى “فاسا – 1” (VASA – 1) يلتقط صورة وجه بسيطة ويسجل مقطعًا صوتيًا، ثم يحوّلهما إلى فيديو يظهر وجهًا يتحرك ويتحدث بطريقة واقعية جداً.
هذه التقنية تعمل عليها شركات أخرى أيضًا، مثل “رَنواي” Runway، وباحثون في “غوغل” أنشأوا برنامجًا يدعى “فلوغر” قادرًا على إنشاء مقاطع فيديو واقعية لوجوه تتكلم.
تؤكد “مايكروسوفت” أن فوائد هذه التقنية، مثل دعم المساواة في التعليم وتوفير الدعم للأشخاص الذين يعانون من صعوبات في التواصل، تبرر العمل على تطويرها.