Alibaba تكشف عن Qwen 3 ، وهي عائلة من نماذج التفكير “الهجينة”

eshrag منذ 4 ساعات

0 1 2 دقائق

Alibaba تكشف عن Qwen 3 ، وهي عائلة من نماذج التفكير “الهجينة”

أصدرت شركة التكنولوجيا الصينية Alibaba يوم الاثنين Qwen 3 ، وهي عائلة من طرازات الذكاء الاصطناعى التي تطالب بها الشركة ، وفي بعض الحالات تتفوق على أفضل النماذج المتاحة من Google و Openai.

تتوفر معظم النماذج – أو ستكون قريبًا – للتنزيل بموجب ترخيص “مفتوح” من منصة AI Dev Hugging Face و Github. وهي تتراوح حجمها من 0.6 مليار معلمة إلى 235 مليار معلمة. تتوافق المعلمات تقريبًا مع مهارات حل المشكلات في النموذج ، وتؤدي النماذج ذات المعلمات بشكل عام بشكل أفضل من تلك التي تحتوي على معلمات أقل.

زاد ارتفاع سلسلة النماذج المصنوعة من الصين مثل Qwen من الضغط على المختبرات الأمريكية مثل Openai لتقديم تقنيات الذكاء الاصطناعى أكثر قدرة. لقد قادوا أيضًا صناع السياسة إلى تنفيذ قيود تهدف إلى الحد من قدرة شركات الذكاء الاصطناعى الصينيين على الحصول على الرقائق اللازمة لتدريب النماذج.

وفقًا لأبابا ، فإن نماذج Qwen 3 عبارة عن نماذج “هجينة” ، بمعنى أنها قد تستغرق وقتًا و “سببًا” من خلال المشكلات المعقدة أو الإجابة على طلبات أبسط بسرعة. يمكّن التفكير النماذج من التحقق بشكل فعال من الحقائق ، على غرار نماذج مثل Openai’s O3 ، ولكن على حساب الكمون الأعلى.

وكتب فريق Qwen في منشور مدونة: “لدينا أنماط تفكير ومدمجة بسلاسة ، ونقدم للمستخدمين المرونة للتحكم في ميزانية التفكير”. “يمكّن هذا التصميم المستخدمين من تكوين ميزانيات خاصة بالمهمة بسهولة أكبر.”

يقول Alibaba ، إن طرازات QWEN 3 تدعم 119 لغة ، وتم تدريبها على مجموعة بيانات تبلغ حوالي 36 تريليون رمزًا. الرموز هي البتات الخام من البيانات التي يعالجها النموذج ؛ مليون الرموز تعادل حوالي 750،000 كلمة. يقول Alibaba إن Qwen 3 تم تدريبه على مجموعة من الكتب المدرسية ، و “أزواج الإجابة عن الأسئلة” ، ومقتطفات التعليمات البرمجية ، والبيانات التي يتم إنشاؤها من الذكاء الاصطناعي ، وأكثر من ذلك.

هذه التحسينات ، إلى جانب الآخرين ، عززت بشكل كبير أداء Qwen 3 مقارنة بسلفها ، Qwen 2 ، إن علي بابا. على Codeforces ، منصة لمسابقات البرمجة ، فإن أكبر طراز QWEN 3-QWEN-3-235B-A22B-يتفوق فقط على Openai’s O3-Mini و Google’s Gemini 2.5 Pro. QWEN-3-235B-A22B أيضًا أفضل O3-MINI على أحدث إصدار من AIME ، وهو معيار للرياضيات الصعبة ، و BFCL ، وهو اختبار لتقييم قدرة النموذج على “التفكير” حول المشكلات.

لكن QWEN-3-235B-A22B غير متاح للجمهور-على الأقل ليس بعد.

نتائج المعيار الداخلي لألبابا لـ Qwen 3.ائتمانات الصورة:علي بابا

لا يزال أكبر طراز QWEN 3 العام ، QWEN3-32B ، قادرًا على المنافسة مع عدد من نماذج الذكاء الاصطناعى الملكية والمفتوحة ، بما في ذلك R1 الصينية AI Lab Deepseek. Qwen3-32b يتجاوز نموذج Openai O1 في العديد من الاختبارات ، بما في ذلك معيار دقة يسمى LiveBench.

يقول Alibaba إن Qwen 3 “Excels” في إمكانيات استدعاء الأدوات بالإضافة إلى اتباع الإرشادات ونسخ تنسيقات بيانات محددة. بالإضافة إلى نماذج التنزيل ، يتوفر Qwen 3 من مقدمي الخدمات السحابية بما في ذلك الألعاب النارية AI و Vyridlec.

قال Tuhin Srivastava ، المؤسس المشارك والرئيس التنفيذي لشركة AI Cloud Host Baseten ، إن Qwen 3 هو نقطة أخرى في خط الاتجاه للنماذج المفتوحة في مواكبة الأنظمة المغلقة مثل Openai.

“تضاعف الولايات المتحدة تقييد مبيعات الرقائق على الصين والمشتريات من الصين ، ولكن نماذج مثل Qwen 3 التي هي حديثة ومفتوحة […] وقال لـ TechCrunch في بيان: “إنه سيتم استخدامه بلا شك محليًا. إنه يعكس حقيقة أن الشركات على حد سواء تقوم ببناء أدواتها الخاصة [as well as] شراء الرف عبر شركات طراز مغلق مثل الأنثروبور و Openai. “

المصدر