هل يستطيع الذكاء الاصطناعي فهم المفاهيم ذات الصلة بعد تعلم واحد فقط؟

هل يستطيع الذكاء الاصطناعي فهم المفاهيم ذات الصلة بعد تعلم واحد فقط؟
يتمتع البشر بالقدرة على تعلم مفهوم جديد ثم استخدامه على الفور لفهم الاستخدامات ذات الصلة بهذا المفهوم – بمجرد أن يعرف الأطفال كيفية “التخطي”، يفهمون ما يعنيه “التخطي مرتين حول الغرفة” أو “التخطي مع طفلك”. ارفع يديك.”
لكن هل الآلات قادرة على هذا النوع من التفكير؟ في أواخر الثمانينيات، افترض جيري فودور وزينون بيليشين، الفلاسفة وعلماء الإدراك، أن الشبكات العصبية الاصطناعية – المحركات التي تحرك الذكاء الاصطناعي والتعلم الآلي – ليست قادرة على إجراء هذه الروابط، المعروفة باسم “التعميمات التركيبية”. ومع ذلك، في العقود التي تلت ذلك، عمل العلماء على تطوير طرق لغرس هذه القدرة في الشبكات العصبية والتقنيات ذات الصلة، ولكن بنجاح متباين، وبالتالي الحفاظ على هذا الجدل المستمر منذ عقود.
وقد طور باحثون في جامعة نيويورك وجامعة بومبيو فابرا الإسبانية تقنية – تم نشرها في مجلة Nature – تعمل على تطوير قدرة هذه الأدوات، مثل ChatGPT، على إجراء تعميمات تركيبية. هذه التقنية، التعلم التلوي من أجل التركيب (MLC)، تتفوق في الأداء على الأساليب الحالية وتتساوى مع الأداء البشري، وفي بعض الحالات أفضل منه. تركز MLC على تدريب الشبكات العصبية – المحركات التي تحرك ChatGPT والتقنيات ذات الصلة للتعرف على الكلام ومعالجة اللغة الطبيعية – لتصبح أفضل في التعميم التركيبي من خلال الممارسة.
كان مطورو الأنظمة الحالية، بما في ذلك نماذج اللغة الكبيرة، يأملون في ظهور التعميم التركيبي من أساليب التدريب القياسية، أو قاموا بتطوير بنيات ذات أغراض خاصة من أجل تحقيق هذه القدرات. في المقابل، يُظهر MLC كيف أن ممارسة هذه المهارات بشكل صريح يسمح لهذه الأنظمة بإطلاق العنان لقوى جديدة، كما لاحظ المؤلفون.
يقول بريندن ليك، الأستاذ المساعد في مركز علوم البيانات وقسم علم النفس وعلم النفس بجامعة نيويورك: “على مدى 35 عامًا، كان الباحثون في العلوم المعرفية والذكاء الاصطناعي واللغويات والفلسفة يناقشون ما إذا كانت الشبكات العصبية يمكنها تحقيق تعميم منهجي يشبه الإنسان”. أحد مؤلفي الورقة. “لقد أظهرنا، لأول مرة، أن الشبكة العصبية العامة يمكن أن تحاكي أو تتجاوز التعميم المنهجي البشري في المقارنة وجهاً لوجه.”
لاستكشاف إمكانية تعزيز التعلم التركيبي في الشبكات العصبية، أنشأ الباحثون MLC، وهو إجراء تعليمي جديد يتم من خلاله تحديث الشبكة العصبية باستمرار لتحسين مهاراتها عبر سلسلة من الحلقات. في إحدى الحلقات، يتلقى MLC كلمة جديدة ويطلب منه استخدامها بشكل تركيبي – على سبيل المثال، لأخذ كلمة “القفز” ثم إنشاء مجموعات كلمات جديدة، مثل “القفز مرتين” أو “القفز لليمين مرتين”. تتلقى MLC بعد ذلك حلقة جديدة تحتوي على كلمة مختلفة، وهكذا، في كل مرة تعمل على تحسين المهارات التركيبية للشبكة.
لاختبار فعالية MLC، ليك، المدير المشارك لمبادرة العقول والأدمغة والآلات بجامعة نيويورك، وماركو باروني، الباحث في المعهد الكاتالوني للبحوث والدراسات المتقدمة والأستاذ في قسم الترجمة وعلوم اللغة في بومبيو فابرا أجرت الجامعة سلسلة من التجارب مع مشاركين بشريين كانت مطابقة للمهام التي يؤديها MLC.
بالإضافة إلى ذلك، بدلاً من تعلم معنى الكلمات الفعلية – وهي مصطلحات يعرفها البشر بالفعل – كان عليهم أيضًا تعلم معنى المصطلحات التي لا معنى لها (على سبيل المثال، “zup” و”dax”) كما حددها الباحثون ومعرفة كيفية فهمها. تطبيقها بطرق مختلفة. كان أداء MLC مماثلاً للمشاركين من البشر، وفي بعض الحالات أفضل من نظرائه من البشر. كما تفوقت MLC وpeople على ChatGPT وGPT-4، والتي على الرغم من قدراتها العامة المذهلة، أظهرت صعوبات في مهمة التعلم هذه.
يقول باروني، وهو عضو في مجموعة أبحاث اللغويات الحاسوبية والنظرية اللغوية بجامعة بومبيو فابرا: “لا تزال نماذج اللغات الكبيرة مثل ChatGPT تعاني من التعميم التركيبي، على الرغم من أنها تحسنت في السنوات الأخيرة”. “لكننا نعتقد أن لغة MLC يمكنها تحسين المهارات التركيبية لنماذج اللغات الكبيرة.”