تطلق شركة علي بابا منافسًا “مفتوحًا” لنموذج الاستدلال o1 الخاص بشركة OpenAI
لقد وصل إلى الساحة نموذج جديد للذكاء الاصطناعي “المنطقي”، QwQ-32B-Preview. إنها واحدة من البرامج القليلة التي تنافس OpenAI’s o1، وهي الأولى المتاحة للتنزيل بموجب ترخيص متساهل.
تم تطوير QwQ-32B-Preview بواسطة فريق Qwen التابع لشركة Alibaba، والذي يحتوي على 32.5 مليار معلمة ويمكن أن يأخذ في الاعتبار مطالبات تصل إلى 32000 كلمة تقريبًا، ويعمل بشكل أفضل في معايير معينة من o1-preview وo1-mini، وهما نموذجان للاستدلال أصدرتهما OpenAI حتى الآن. تتوافق المعلمات تقريبًا مع مهارات حل المشكلات الخاصة بالنموذج، والنماذج التي تحتوي على معلمات أكثر تؤدي عمومًا أداءً أفضل من تلك التي تحتوي على معلمات أقل.
وفقًا لاختبارات Alibaba، يتفوق QwQ-32B-Preview على نماذج OpenAI’s o1 في اختبارات AIME وMATH. يستخدم AIME نماذج الذكاء الاصطناعي الأخرى لتقييم أداء النموذج، في حين أن MATH عبارة عن مجموعة من المسائل الكلامية.
يمكن لـ QwQ-32B-Preview حل الألغاز المنطقية والإجابة على أسئلة الرياضيات الصعبة إلى حد معقول، وذلك بفضل قدرات “الاستدلال” الخاصة به. لكنها ليست مثالية. تشير علي بابا في منشور على مدونة إلى أن النموذج قد يبدل اللغات بشكل غير متوقع، ويتعثر في الحلقات، ويضعف أداء المهام التي تتطلب “المنطق السليم”.
على عكس معظم الذكاء الاصطناعي، تقوم QwQ-32B-Preview ونماذج الاستدلال الأخرى بالتحقق من الحقائق بشكل فعال. وهذا يساعدهم على تجنب بعض المخاطر التي عادة ما تؤدي إلى تعثر النماذج، مع الجانب السلبي المتمثل في أنها غالبًا ما تستغرق وقتًا أطول للتوصل إلى الحلول. على غرار o1، يقوم QwQ-32B-Preview بإجراء الأسباب من خلال المهام والتخطيط المسبق وتنفيذ سلسلة من الإجراءات التي تساعد النموذج في الحصول على الإجابات.
يبدو أن QwQ-32B-Preview، الذي يمكن تشغيله وتنزيله من منصة تطوير الذكاء الاصطناعي Hugging Face، يشبه نموذج الاستدلال DeepSeek الذي تم إصداره مؤخرًا من حيث أن بعض المواضيع محظورة. وتخضع شركتا علي بابا وديب سيك، باعتبارهما شركتين صينيتين، لتقييم من قبل هيئة تنظيم الإنترنت في الصين لضمان أن استجابات نماذجهما “تجسد القيم الاشتراكية الأساسية”. ترفض العديد من أنظمة الذكاء الاصطناعي الصينية الاستجابة للمواضيع التي قد تثير حفيظة الجهات التنظيمية، مثل التكهنات حول نظام شي جين بينغ.
وعندما سُئل “هل تايوان جزء من الصين؟”، أجاب QwQ-32B-Preview بأن الأمر كذلك، وهو منظور لا يتماشى مع معظم دول العالم ولكنه يتماشى مع وجهة نظر الحزب الحاكم في الصين. وفي الوقت نفسه، لم تسفر المطالبات المتعلقة بميدان تيانانمن عن عدم الاستجابة.
QwQ-32B-Preview متاح “بشكل مفتوح” بموجب ترخيص Apache 2.0، مما يعني أنه يمكن استخدامه للتطبيقات التجارية. ولكن تم إصدار مكونات معينة فقط من النموذج، مما يجعل من المستحيل تكرار QwQ-32B-Preview أو الحصول على نظرة ثاقبة للعمل الداخلي للنظام.
يأتي الاهتمام المتزايد بنماذج الاستدلال في الوقت الذي تخضع فيه صلاحية “قوانين القياس”، وهي نظريات قديمة العهد مفادها أن إلقاء المزيد من البيانات والقدرة الحاسوبية على النموذج من شأنه أن يزيد باستمرار من قدراته، للتدقيق. تشير سلسلة من التقارير الصحفية إلى أن النماذج من مختبرات الذكاء الاصطناعي الكبرى بما في ذلك OpenAI وGoogle وAnthropic لا تتحسن بشكل كبير كما كانت من قبل.
وقد أدى ذلك إلى التدافع نحو أساليب الذكاء الاصطناعي والهندسة المعمارية وتقنيات التطوير الجديدة. أحدهما هو حساب وقت الاختبار، والذي يدعم نماذج مثل o1 وDeepSeek. المعروف أيضًا باسم حساب الاستدلال، يمنح حساب وقت الاختبار النماذج وقتًا إضافيًا للمعالجة لإكمال المهام.
وتراهن المعامل الكبرى إلى جانب OpenAI والمشاريع الصينية على أن هذا هو المستقبل. وفقًا لتقرير حديث صادر عن The Information، قامت Google مؤخرًا بتوسيع فريق الاستدلال الخاص بها إلى حوالي 200 شخص وإضافة قوة حاسوبية.
اكتشاف المزيد من اشراق اون لاين
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.