أعلنت شركة مايكروسوفت، اليوم الثلاثاء، إطلاقها نموذج ذكاء اصطناعي جديد ذي لغة صغيرة، يتميز بفعاليته وتكلفته البسيطة.
وقالت الشركة في بيان صحافي، إن النموذج الجديد يمكنه أداء العديد من المهم مثل إنشاء المحتوى والمنشورات عبر وسائل التواصل الاجتماعي، باستخدام كمية قليلة من البيانات.
ويتميز النموذج المسمى Phi-3-mini، بتفوقه على النماذج الأكبر من خلال عدة معايير، والتي تقيم قدرات اللغة والترميز والرياضيات.
استخدامات النموذج
بحسب مايكروسوفت، فإن النموذج تم تصميمه لأداء مهام بسيطة، ليكون خيارًا مناسبًا للشركات ذات الموارد المحدودة.
ويساعد Phi-3 الشركات على إعداد ملخصات للنقاط الرئيسية في الوثائق الطويلة، إلى جانب استخلاص الأفكار ذات الصلة واتجاهات الصناعة من تقارير أبحاث السوق.
وتوفر الشركة النموذج الجديد على كتالوج نماذج AI لمنصة الخدمة السحابية Microsoft Azure، ومنصة نماذج التعلم الآلي Hugging Face، وOllama، وهو إطار عمل لتشغيل النماذج على جهاز محلي.
ولكن ما هي نماذج اللغة الصغيرة؟
هو نموذج ذكاء اصطناعي توليدي خفيف الوزن يُشار إليه بـ “SLM”، وترجع تسميته بـ “صغير” إلى حجم الشبكة العصبية المستخدمة في صناعته، وحجم البيانات التي تم تدريبه عليها.
وعلى عكس نماذج اللغة الكبيرة LLMs والتي تم تدريبها على بيانات أكبر، تكون النماذج الصغيرة مناسبة للعمليات البسيطة.
ما الفرق بين النماذج الصغيرة والكبيرة للذكاء الاصطناعي؟
بخلاف حجم البيانات المطلوبة للتدريب وكذلك الشبكات العصبية المستخدمة في صناعة كل منهما، هناك اختلافات أخرى بين النوعين من النماذج.
وكمثال تحتاج نماذج اللغات الكبيرة مثل ChatGPT و Google Bard، إلى بنية معقدة للتعلم العميق، إلى جانب مساحة أكبر من التخزين، وكميات ضخمة من الكهرباء للعمل.
ولكن هذه الفوارق التي تظهر أيضًا في السعر، أكسبت عمالقة التقنية ميزات كبرى من خلال الاستفادة بنماذج التعلم الكبيرة وإمكاناتها، في مقابل الشركات الصغيرة ذات الدخول المحدودة التي لم تتمكن من استخدام ذات التقنية.
ولكن بتطوير تلك النماذج الصغيرة، بات بإمكان الشركات الناشئة وغيرها من الشركات الصغيرة باستخدام نماذج لغة خاصة بها.
ولأن بنية النماذ الصغيرة أبسط بكثيرة من نظيرتها الكبيرة، فإنها مناسبة للاستخدام على الأجهزة المحمولة.
ومن بين الميزات الأخرى في النماذج الصغيرة للذكاء الاصطناعي، هي إمكانية معالجة البيانات محليًا، وهو أمر مهم بشكل خاص للأجهزة الطرفية التي تعمل بإنترنت الأشياء (IoT) والشركات التي تحتاج إلى الالتزام بسياسات الخصوصية والأمان الصارمة .
ولكن على الجانب الآخر فإن حجم المعلومات الصغير الذي تم تدريب تلك النماذج عليه يخلق بعض المشكلات مثل: محدودية المعرفة، وفهم أضيق للغة والسياق، واستجابات أقل دقة، مقارنة بالنماذج الأكبر.
المصدر: reuters/techopedia