«Grok» و«OpenAi» يقتسمان صدارة أذكى نماذج الذكاء الاصطناعي لعام 2026

حقق نموذجا «جروك 4.20 إكسبرت مود» و«أوبن إيه آي جي بي تي 5.4 برو للرؤية» المركز الأول في تصنيف أذكى نماذج الذكاء الاصطناعي لعام 2026، بعد تسجيل كل منهما 145 نقطة.

جاء هذا الإنجاز ضمن نتائج اختبار «Mensa Norway»، التي نشرتها منصة «TrackingAI» بالتزامن مع فعاليات أسبوع الذكاء الاصطناعي «AI Week»، على منصة «Visual Capitalist».

كشفت هذه البيانات الجديدة عن قفزة ملحوظة في تطور قدرات النماذج مقارنة بالعام الماضي، الذي سجل أعلى معدل فيه 135 نقطة فقط، مما يعكس تحسنًا سريعًا وملموسًا في مجالات الاستدلال والتعرف على الأنماط البصرية لدى الأنظمة المتقدمة.

وفي سياق ترتيب بقية المنافسين، حل نموذج «Gemini 3.1 Pro Preview» في المرتبة الثالثة برصيد 141 نقطة، وتبعه نموذج «OpenAI GPT 5.4 Thinking Vision» مسجلًا 139 نقطة، ومن ثم نموذج «OpenAI GPT 5.3» بواقع 136 درجة. كما شهدت القائمة تساوي ثلاثة نماذج عند حاجز 133 نقطة، وهي نماذج «Grok-4.20 Expert Mode Vision» و«OpenAI GPT 5.4 Thinking» و«Meta Muse Spark».

ومع هذا التقارب الكبير، بدأت بقية النتائج بالتراجع تدريجيًا لتتراوح بين 132 و111 نقطة، حيث سجل كل من «Qwen 3.5» و«Claude-4.6 Opus» نحو 130 درجة، وحقق «Kimi K2.5» رصيد 127 نقطة، ووصل نموذج «Manus» إلى 115 درجة. وفي نهاية القائمة، أنهى نموذج «DeepSeek R1» الاختبار بـ 112 نقطة، وتبعه «DeepSeek V3» مسجلًا 111 درجة، بينما برزت المفاجأة الكبرى في التصنيف بتسجيل أفضل نماذج شركة «Mistral» أدنى نتيجة في البيانات بواقع 97 نقطة فقط، مما كشف عن فجوة واسعة تفصلها عن نماذج القمة المتصدرة.

معايير التقييم

وأوضحت منصة «TrackingAI» أن منهجية هذه التقييمات تعتمد بشكل كلي على اختبار «Mensa Norway» العام، الذي يضم 35 سؤالًا تعتمد في جوهرها على الأنماط البصرية.

وقدمت المنصة تلك الأسئلة كنصوص للنماذج التي لا تدعم ميزة الرؤية، بينما تسلمت النماذج البصرية الصور الأصلية مباشرة لضمان دقة النتائج.

وتضمنت المنهجية المتبعة إعادة طرح السؤال الواحد حتى 10 مرات في حال رفض النموذج تقديم إجابة في المرة الأولى، مع اعتماد الإجابة الأخيرة والنهائية في رصد الدرجة الكلية.

وعلى الرغم من دقة هذه الأرقام، أوضح القائمون على المنصة أن هذه النتائج «تمثل معيار مقارنة فقط وليست مقياسًا شاملًا للذكاء». كما لفتوا إلى أن هذا المؤشر يراقب تطور الاستدلال المنطقي عبر الزمن، ولا يغطي جوانب الأداء الفنية الأخرى مثل البرمجة، أو دقة المعلومات، أو استخدام الأدوات، أو الكفاءة في التطبيقات المهنية المختلفة.

ويجسد تقرير أبريل 2026 اشتعال حدة التنافس عند قمة الهرم التقني، مع استمرار تسارع التطور في القدرات التحليلية للأنظمة الرائدة. وتشير الأرقام بوضوح إلى اتساع الفجوة الفنية بين الشركات التي تلاحق الصدارة وبين بقية المنافسين الآخرين في سوق الذكاء الاصطناعي العالمي.