أمازون تنافس بقوة بتطوير نموذج ذكاء اصطناعي صوتي وآخر لصناعة الفيديو

أمازون تنافس بقوة بتطوير نموذج ذكاء اصطناعي صوتي وآخر لصناعة الفيديو
في خطة للتغلب على منافسيها، تتوسع أمازون لتطوير نفسها من خلال إنشاء نماذج توليدية للذكاء الاصطناعي تجذب أكبر قدر من العملاء من خلال إنشاء نموذج صوتي باسم Amazon Nova Sonic يتجاوب مع الحوار البشري، وآخر باسم Amazon Nova Reel الذي يستطيع إنشاء فيديوهات بالذكاء الاصطناعي تصل إلى دقيقتين.
ما هو Amazon Nova Sonic ؟
يتميز نموذج سونيك – وفق أمازون- بأنه قادر على فهم ما تقول بل يدرك ما وراء كلماتك، فهو قادر على فهم وتحليل العواطف البشرية، والرد بصوت بشري.
ويتوفر سونيك في واجهة برمجة التطبيقات الجديدة على Amazon Bedrock، وهي خدمة من الشركة تقدم مجموعة من نماذج التأسيس عالية الأداء من شركات الذكاء الاصطناعي الرائدة، مع تزويد العميل بقدرات لإنشاء تطبيقات ذكاء اصطناعي.
ويتمكن النموذج الجديد من تطوير التطبيقات الصوتية مثل أتمتة خدمة العملاء، ووكلاء الذكاء الاصطناعي من مختلف القطاعات، مثل: السفر والتعليم والصحة والترفيه وغيرها.
وتضرب أمازون نموذج حقيقي في مدونتها، بتقديم حوار صوتي بين امرأة و وكيل ذكاء اصطناعي للسفر الذي فهم معاني كلماتها وشعورها بالقلق من سعر تذاكر السفر المرتفعة، فيخفض نبرة صوته لطمأنتها ويبحث على تذاكر طيران منخفضة السعر ويعرضها عليها، فتوافق و يحجز التذاكر لها بنفسه.
وترى أمازون أنها نجحت في توفيق أكثر من نموذج في نموذج واحد يصعب التوفيق بينهم في التطبيقات الصوتية، هذا التوحيد يمكن النماذج لتوليد رد حسب السياق من شكل النبرة وطريقة الكلام، كما يفطن سونيك طبيعة الفروق الفردية في الحوار البشري مثل وقفات صوت المتحدث وترددات كلامه والانتظار حتى يفرغ من الحوار.
Amazon Nova Reel
تتجه أمازون نحو سباق تكوين أفضل نموذج ذكاء اصطناعي توليدي للفيديوهات على منصة Bedrock، وتقدم Amazon Nova Reel 1.1 تطورات في جودة توليد المقطع ذو ال6 ثوان، وذلك على عكس إصدارها الأقدم Amazon Nova Reel 1.0.
هذا التحديث يمكن المستخدم من توليد فيديو ذو مقاطع متعددة تصل مدتها لدقيقتين مع أسلوب متسق خلال اللقطات.
ويمكن تقسيم الفيديو ذو الدقيقتين إلى مقاطع كل مقطع مدته 6 ثواني، أو تصميم كل لقطة على حدة بأوامروأوصاف معينة.
ويقلل نموذج أمازون الوقت والتكلفة في إنتاج الفيديوهات ذات الشكل الحقيقي الواقعي أو الكارتوني (الرسوم المتحركة للأطفال)، كما يمكن تطبيقه في الحملات التسويقية، وتصميم المنتجات، وصناعة محتوى وسائل التواصل الاجتماعي بجودة عالية باستخدام اللغة الطبيعية.