موكا من ميتا: نظام ذكاء اصطناعي يحول النصوص إلى شخصيات متحركة بجودة سينمائية

أضيف بتاريخ 04/10/2025

منصة ذكاء

كشفت شركة ميتا عن نظام موكا (MoCha)، وهو نظام ذكاء اصطناعي متطور يمثل قفزة نوعية في مجال تحريك الشخصيات الرقمية. يستخدم النظام نموذجًا تحويليًا يضم 30 مليار معامل، ويولد مقاطع فيديو عالية الجودة بمعدل 24 إطارًا في الثانية.

بالتعاون مع جامعة ووترلو، طور فريق ميتا هذا النظام الذي يتميز بقدرته على إنتاج حركات جسدية كاملة مع مزامنة دقيقة للشفاه من زوايا كاميرا متعددة. يستخدم النظام تقنية مبتكرة تسمى "audio-visual window attention" لحل مشكلتين رئيسيتين في توليد الفيديو: الحفاظ على جودة الصوت الكاملة أثناء ضغط الفيديو، وتجنب عدم التزامن بين الصوت وحركة الشفاه.

يتميز موكا بقدرته على إدارة المحادثات بين شخصيات متعددة، حيث يمكن للمستخدمين تحديد الشخصيات مرة واحدة والإشارة إليها بعلامات بسيطة. كما يوفر النظام تحكمًا دقيقًا في العواطف وتعابير الوجه، مما يجعل المشاهد أكثر واقعية وتفاعلية.

يفتح هذا النظام آفاقًا جديدة في مجالات متعددة، من صناعة السينما والرسوم المتحركة إلى الألعاب والواقع الافتراضي. يمكن للمبدعين الآن إنتاج رسوم متحركة عالية الجودة باستخدام النص والصوت فقط، مما يقلل بشكل كبير من تكلفة ووقت إنتاج المحتوى.