بينما لا تُظهر أنظمة الذكاء الاصطناعي أي علامات على التباطؤ في الوقت الراهن، فإن هناك قلقًا متزايدًا يتصاعد في الأوساط العلمية من أن النماذج اللغوية الكبيرة ستنفد قريبًا من البيانات التي صنعها البشر لامتصاصها والتعلم منها.
ويشير العلماء إلى أنه بمجرد حدوث هذا النفاذ، ستعتمد نماذج الذكاء الاصطناعي بشكل متزايد على المعلومات الاصطناعية المولّدة بواسطة الآلة نفسها، ما سيؤدي حتمًا إلى تأثير خطير يسمى "انهيار النموذج". وفي هذه الحالة، تبدأ البرمجيات في إنتاج نصوص غير مفهومة وتزداد معدلات اختلاق المعلومات والهلوسة الرقمية بشكل يفوق ما نشهده اليوم، مما يهدد دقة الأنظمة الذكية التي أصبحت جزءًا لا يتجزأ من حياتنا اليومية.
وأوضح فريق بحثي مشترك من جامعات مختلفة أن التوقعات بنفاذ البيانات البشرية عالية الجودة والمتوقع لها نهاية العام الجاري، تضع مهندسي التقنية في مأزق حقيقي، خاصة وأن الاعتماد الكامل على البيانات الاصطناعية يمثل تهديدًا وجوديًا قد يعصف بكفاءة الذكاء الاصطناعي، بحسب موقع "لايف ساينس".
تداعيات خطيرة لانهيار الذكاء الاصطناعي
استدل الباحثون على ذلك بمثال خطير يتعلق بالقطاع الطبي؛ فإذا تم استخدام هذه النماذج اللغوية في المستشفيات لتحليل فحوصات الدماغ واكتشاف الأورام السرطانية، ثم تعرضت لـ "انهيار النموذج" أثناء تدريب أجيال جديدة منها، فإن النتيجة الحتمية ستكون تشخيص المرضى بشكل خاطئ وتهديد مباشر لأرواحهم.
ورغم أن هذا الانهيار الكارثي لم يحدث بعد في الأنظمة التجارية الحالية، إلا أن مستخدمي أدوات مثل ChatGPT وGemini يلمسون بانتظام أخطاء وهلاوس بسيطة، ما يبرز أهمية هذا الاكتشاف لتفادي التهديدات المستقبلية.
وتُعد خطورة انهيار النموذج أعمق بكثير من فكرة الهلاوس المعتادة؛ فاعتماد التدريب المتكرر للنماذج على بيانات مولدة آليًا يتسبب في تلاشي التباينات اللغوية والمعرفية بين أجيال النماذج، وهو ما يقود إلى توليد إجابات مكررة ووركيكة تفتقر تمامًا إلى العمق والتميز.
وينقسم هذا التدهور إلى مرحلتين؛ مرحلة مبكرة يفقد فيها الذكاء الاصطناعي القدرة على استدعاء المعلومات النادرة وغير الشائعة ومرحلة متأخرة يتدنى فيها مستوى المخرجات ليصبح مجرد هراء لغوي لا معنى له.
الحل المبتكر لمنع تدهور الذكاء الاصطناعي
حملت الدراسة الحديثة بصيصًا من أمل؛ حيث تبين أن إدخال نقطة بيانات واحدة فقط من صنع البشر إلى بيئة التدريب يكفي لتفادي هذا الانهيار، حتى لو كانت بقية البيانات المستخدمة اصطناعية بالكامل.
وللتغلب على هذه المشكلة، لجأ الباحثون إلى استخدام نماذج رياضية أبسط تعتمد على حسابات الاحتمالات، بهدف تنظيم طريقة توليد البيانات داخل أنظمة الذكاء الاصطناعي. وتساعد هذه النماذج على فهم كيفية توزيع البيانات وإنتاجها بشكل أكثر دقة، بما يقلل من اعتماد النماذج على بيانات مولدة سابقًا قد تؤدي إلى تراجع جودة النتائج مع مرور الوقت.
وتعتمد الفكرة الجوهرية للحل على كسر نظام "تدريب الحلقة المغلقة"، وهو النظام الذي يتغذى فيه النموذج الجديد على مخرجات نموذج سابق؛ حيث يؤدي إدخال عنصر بشري واحد مثل صورة حقيقية صنفها إنسان بدقة بدلاً من تصنيف الآلة لها إلى ربط نظام الذكاء الاصطناعي بحقائق يمكن التحقق منها بشكل مستقل.
ويتطلع الفريق البحثي حاليًا إلى تطبيق هذا النهج على نماذج أضخم وأكثر تعقيدًا للتأكد من مرونة هذا المبدأ الصارم وثباته؛ إذ يعد هذا البحث الخطوة الأساسية الأولى لإنشاء قواعد تنظيمية تحمي الأنظمة الذكية المستقبلية وتمنح مهندسي التقنية الأدوات اللازمة لبناء أجيال متطورة من الذكاء الاصطناعي تظل مستقرة ومحصنة ضد الانهيار المعرفي.













