تدعي DeepSeek أن نموذج الاستدلال الخاص بها يتفوق على OpenAI’s o1 في معايير معينة
أصدر مختبر الذكاء الاصطناعي الصيني DeepSeek نسخة مفتوحة من DeepSeek-R1، ما يسمى بنموذج الاستدلال الخاص به، والذي يدعي أنه يؤدي أداءً مشابهًا لـ OpenAI o1 في بعض معايير الذكاء الاصطناعي.
R1 متاح من منصة تطوير الذكاء الاصطناعي Hugging Face بموجب ترخيص MIT، مما يعني أنه يمكن استخدامه تجاريًا دون قيود. وفقًا لـ DeepSeek، يتفوق R1 على o1 في معايير AIME وMATH-500 وSWE-bench Verified. يستخدم AIME نماذج أخرى لتقييم أداء النموذج، في حين أن MATH-500 عبارة عن مجموعة من المسائل الكلامية. وفي الوقت نفسه، يركز SWE-bench Verified على مهام البرمجة.
كونه نموذجًا منطقيًا، يقوم R1 بالتحقق من الحقائق بشكل فعال، مما يساعده على تجنب بعض المخاطر التي عادة ما تتعثر النماذج. تستغرق النماذج الاستدلالية وقتًا أطول قليلًا — عادةً من ثوانٍ إلى دقائق — للوصول إلى الحلول مقارنة بالنموذج غير الاستدلالي النموذجي. الجانب الإيجابي هو أنها تميل إلى أن تكون أكثر موثوقية في مجالات مثل الفيزياء والعلوم والرياضيات.
يحتوي R1 على 671 مليار معلمة، حسبما كشف DeepSeek في تقرير فني. تتوافق المعلمات تقريبًا مع مهارات حل المشكلات الخاصة بالنموذج، والنماذج التي تحتوي على معلمات أكثر تؤدي عمومًا أداءً أفضل من تلك التي تحتوي على معلمات أقل.
يعد 671 مليار معلمة رقمًا ضخمًا، لكن DeepSeek أصدرت أيضًا إصدارات “مقطرة” من R1 تتراوح في الحجم من 1.5 مليار معلمة إلى 70 مليار معلمة. أصغر يمكن تشغيله على جهاز كمبيوتر محمول. أما بالنسبة لـ R1 الكامل، فهو يتطلب أجهزة أقوى، لكنه كذلك يكون متاح من خلال واجهة برمجة التطبيقات الخاصة بـ DeepSeek بأسعار أرخص بنسبة 90% إلى 95% من أسعار OpenAI’s o1.
هناك جانب سلبي لـ R1. ولكونه نموذجًا صينيًا، فإنه يخضع للمعايير من قبل هيئة تنظيم الإنترنت في الصين للتأكد من أن استجاباته “تجسد القيم الاشتراكية الأساسية”. لن يجيب R1 على الأسئلة المتعلقة بميدان تيانانمن، على سبيل المثال، أو الحكم الذاتي في تايوان.
ترفض العديد من أنظمة الذكاء الاصطناعي الصينية، بما في ذلك نماذج الاستدلال الأخرى، الاستجابة للموضوعات التي قد تثير حفيظة المنظمين في البلاد، مثل التكهنات حول نظام شي جين بينغ.
يصل R1 بعد أيام من اقتراح إدارة بايدن المنتهية ولايتها قواعد تصدير وقيود أكثر صرامة على تقنيات الذكاء الاصطناعي للمشروعات الصينية. تم بالفعل منع الشركات في الصين من شراء رقائق الذكاء الاصطناعي المتقدمة، ولكن إذا دخلت القواعد الجديدة حيز التنفيذ كما هو مكتوب، فسوف تواجه الشركات قيودًا أكثر صرامة على كل من تكنولوجيا أشباه الموصلات والنماذج اللازمة لتشغيل أنظمة الذكاء الاصطناعي المتطورة.
وفي وثيقة سياسية الأسبوع الماضي، حثت شركة OpenAI الحكومة الأمريكية على دعم تطوير الذكاء الاصطناعي الأمريكي، خشية أن تضاهيها النماذج الصينية أو تتفوق عليها في القدرات. في مقابلة مع The Information، أشار نائب الرئيس للسياسة في OpenAI كريس ليهان إلى High Flyer Capital Management، الشركة الأم لشركة DeepSeek، باعتبارها منظمة ذات أهمية خاصة.
حتى الآن، أنتجت ثلاثة مختبرات صينية على الأقل – DeepSeek، وAlibaba، وKimi، المملوكة لشركة Moonshot AI الصينية التي يونيكورن – نماذج يزعمون أنها منافسة لـ o1. (من الجدير بالذكر أن DeepSeek كان الأول، حيث أعلن عن معاينة R1 في أواخر نوفمبر). وفي منشور على X، قال دين بول، باحث الذكاء الاصطناعي في جامعة جورج ماسون، إن الاتجاه يشير إلى أن مختبرات الذكاء الاصطناعي الصينية ستستمر في ” متابعين سريعين.”
“الأداء المثير للإعجاب لنماذج DeepSeek المقطرة […] “يعني أن المفكرين ذوي الكفاءة العالية سيستمرون في الانتشار على نطاق واسع وسيكونون قابلين للتشغيل على الأجهزة المحلية،” كما كتب بول، “بعيدًا عن أعين أي نظام تحكم من الأعلى إلى الأسفل”.
اكتشاف المزيد من اشراق اون لاين
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.