علي بابا نهاية “التفكير الهجين الغبي ” وبداية أداء خارق لنماذج Qwen 3

عثمان الشهراني
في اعتراف ضمني بأن فكرتها السابقة لم تكن بالذكاء المتوقع – الذي وصفته بالغبي – ، أعلنت “علي بابا” عن خطوة جريئة: التخلي عن وضع “التفكير الهجين” في سلسلة نماذجها Qwen 3 ، بعد أن تبين أن هذه الميزة التي كانت تبدو مبتكرة عند الإطلاق في أبريل، جاءت على حساب جودة الأداء والدقة في معالجة المهام.
الميزة التي سمحت للنماذج بالتبديل السريع بين “وضع التفكير” و”وضع التنفيذ” بدت واعدة في البداية، لكنها في الواقع أثرت على كفاءة النموذج في اختبارات الذكاء والاستدلال، مما دفع الفريق إلى مراجعة حساباته.
وفي بيان رسمي عبر منصة X، أوضح فريق Qwen:
“قررنا إيقاف استخدام وضع التفكير الهجين بعد مراجعة عميقة ومناقشات مع المستخدمين. سنركز على تدريب نماذج التفكير ونماذج التنفيذ بشكل منفصل، لأن الجودة تأتي أولاً.”
وبالفعل، بدأت علي بابا بطرح إصدارات جديدة تحمل الرمز الزمني 2507، كل منها مخصص بوضوح إما للتنفيذ أو للتفكير. وكانت النتائج مفاجئة ومثيرة للإعجاب:
نموذج Qwen3-235B-A22B-Instruct-2507 على سبيل المثال، حقق أداءً يفوق الإصدار السابق بـ 2.8 مرة في اختبار AIME25 للرياضيات، وهو أحد أصعب الاختبارات المرجعية في المجال. حتى النسخة الأصغر Qwen3-30B-A3B أظهرت تحسنًا كبيرًا في المهام المعيارية غير المعتمدة على التحليل العميق.
أما بالنسبة لنماذج “التفكير العميق” المحدثة، فقد أظهرت تحسنًا واضحًا لكن أقل دراماتيكية، إذ تراوح معدل التحسن ما بين 13% و54% في اختبارات معقدة كـ “امتحان البشرية الأخير”، ما يدل على أن فصل القدرات العقلية للنموذج إلى مهام مستقلة كان خطوة أكثر فعالية من المزج بينهما.
ولأن التفكير العميق يتطلب ذاكرة طويلة المدى، رفعت علي بابا سعة نافذة السياق من 32 ألف إلى 256 ألف رمز، ما يُتيح للنموذج الاحتفاظ بنصوص أطول والتفكير لمدة أطول دون فقدان التسلسل. وقد أوصى الفريق بتعيين حد أدنى يبلغ 128 ألف رمز للاستفادة الكاملة من هذه السعة – خاصة في المهام المعقدة التي تتطلب تأمل وتحليل متعمق.
وعلى الجانب التقني، تم طرح هذه النماذج بصيغتي BF16 وFP8، مع توقعات بطرح نسخ مضغوطة أكثر مثل 4-bit AWQ قريبًا. ولمح المطور Junyang Lin أيضًا إلى إصدار قريب مخصص للبرمجة من نموذج Qwen3-30B – ما يعني أن التحديثات ما زالت تتوالى.
ورغم التخلي عن الوضع الهجين في الوقت الراهن، إلا أن فريق Qwen لم يطوِ الصفحة تمامًا، بل أكد أن الأبحاث لا تزال جارية لتحسين هذا النمط من التفكير، على أمل أن يعود في المستقبل ولكن هذه المرة… بذكاءٍ حقيقي.