ChatGPT o3 من OpenAI ثورة في التفكير المنطقي للذكاء الاصطناعي
يشهد عالم الذكاء الاصطناعي منافسة شرسة. فبعد 24 ساعة فقط من إعلان جوجل عن نموذجها Gemini 2.0 Flash Thinking، ردّت OpenAI بإطلاق o3، وهو نموذج لغوي كبير جديد (LLM).
يعتبر o3 خليفة النموذج o1 (تجنبت OpenAI تسمية o2 لتفادي أي تعارض مع شركة الاتصالات البريطانية التي تحمل نفس الاسم). ويُظهر o3 أداءً مذهلاً.
وفقًا لـ OpenAI، فإن o3 يتفوق على سابقه بثلاثة أضعاف في اختبارات ARC-AGI، وهو معيار مصمم لتقييم قدرة نموذج الذكاء الاصطناعي على التفكير في المشكلات الرياضية والمنطقية المعقدة للغاية.
ما يميز o3 حقًا هو قدرته على "التفكير مليًا" في المشكلة قبل تقديم إجابة. على عكس النماذج التقليدية التي تجيب بشكل فوري تقريبًا، يأخذ o3 وقتًا لتحليل الأسئلة المطروحة عليه بعمق، خاصة تلك التي تتطلب تفكيرًا منطقيًا خطوة بخطوة.
نتائج OpenAI o3 في معايير ARC-AGI:
يسمح o3، على عكس o1، بالاختيار بين ثلاثة مستويات من وقت التفكير: منخفض ومتوسط وعالٍ. كما تتخيل، في المستوى المنخفض، تُنفذ المهام بسرعة أكبر، ولكنها قد تكون عرضة لأوجه عدم الدقة، بينما في المستوى العالي، يكون العكس صحيحًا: أبطأ، ولكنه أكثر دقة.
يقول سام ألتمان، الرئيس التنفيذي لـ OpenAI: "نحن نعتبر هذا بداية المرحلة التالية من الذكاء الاصطناعي، حيث ستتمكن هذه النماذج من أداء مهام معقدة بشكل متزايد تتطلب تفكيرًا عميقًا". يصبح هذا التصريح ذا معنى عندما نفحص أداء النموذج في البرمجة وحل المشكلات العلمية المتقدمة.
ما هي "المواءمة التداولية"؟
أعلنت OpenAI أيضًا عن تقنية أمان: "المواءمة التداولية".
يعتمد هذا النهج على تدريب النموذج مع قيود أمان محددة، مما يسمح له بتحليل طبيعة الطلبات وإجاباته للكشف عن أي انتهاكات محتملة لضوابط السلامة الخاصة به. الفكرة هي جعل النموذج أكثر مقاومة لمحاولات التحايل عليه.
متى سيتوفر o3؟
في الوقت الحالي، o3 غير متاح. تخطط OpenAI لإنشاء نظام طلبات للسماح لمختبرين خارجيين باستخدام النموذج الجديد.
باختصار o3 يمثل قفزة نوعية في قدرات نماذج الذكاء الاصطناعي، حيث يركز على التفكير العميق وتحليل المشكلات المعقدة، بالإضافة إلى تعزيز جوانب الأمان.

