تدعي Deepseek أن نموذجها “التفكير” يتفوق على Openai’s O1 على معايير معينة

eshrag يناير 28, 2025

0 28 3 دقائق

تدعي Deepseek أن نموذجها “التفكير” يتفوق على Openai’s O1 على معايير معينة

أصدرت AI Lab Deepseek نسخة مفتوحة من Deepseek-R1 ، ما يسمى نموذج التفكير ، الذي يدعي أداءه وكذلك Openai’s O1 على معايير معينة من الذكاء الاصطناعي.

R1 متاح من منصة AI Dev التي تعانق تحت رخصة معهد ماساتشوستس للتكنولوجيا ، مما يعني أنه يمكن استخدامه تجاريًا دون قيود. وفقًا لـ Deepseek ، يتفوق R1 على O1 على المعايير AIME و MATH-500 و SWE-BENCED. توظف AIME نماذج أخرى لتقييم أداء النموذج ، في حين أن MATH-500 هي مجموعة من مشاكل الكلمات. وفي الوقت نفسه ، يركز Swe-bench على مهام البرمجة.

نظرًا لكونه نموذجًا للتفكير ، فإن R1 يقوم بتقسيم الحقائق بشكل فعال ، مما يساعده على تجنب بعض المزالق التي عادة ما تكون على النماذج. تستغرق نماذج التفكير وقتًا أطول قليلاً – عادةً ثوانٍ إلى دقائق أطول – للوصول إلى حلول مقارنة بنموذج غير نموذجي. الاتجاه الصعودي هو أنهم يميلون إلى أن يكونوا أكثر موثوقية في المجالات مثل الفيزياء والعلوم والرياضيات.

R1 يحتوي على 671 مليار معلمة ، تم الكشف عن Deepseek في تقرير فني. تتوافق المعلمات تقريبًا مع مهارات حل المشكلات في النموذج ، وتؤدي النماذج ذات المعلمات بشكل عام بشكل أفضل من تلك التي تحتوي على معلمات أقل.

في الواقع ، 671 مليار معلمة ضخمة ، لكن ديبسيك أصدر أيضًا إصدارات “مقطرة” من R1 تتراوح حجمها من 1.5 مليار معلمة إلى 70 مليار معلمة. أصغر يمكن تشغيل على جهاز كمبيوتر محمول. بالنسبة إلى R1 الكامل ، فإنه يتطلب أجهزة أكثر يكون متوفر من خلال API من DeepSeek بأسعار 90 ٪ -95 ٪ أرخص من Openai’s O1.

قال Clem Delangue ، الرئيس التنفيذي لشركة Hugging Face ، في منشور يوم X يوم الاثنين إن المطورين على المنصة قد أنشأوا أكثر من 500 طراز “مشتق” من R1 الذي حقق 2.5 مليون تنزيل مجتمعة – خمسة أضعاف عدد التنزيلات الرسمية R1 حصلت.

تم إصداره قبل بضعة أيام فقط وأكثر من 500 نموذج مشتق deepeek_ai تم إنشاؤه في جميع أنحاء العالم huggingface مع 2.5 مليون تنزيل (5x الأوزان الأصلية).

قوة اللامركزية مفتوحة المصدر!

– Clem 🤗 (@clementDelangue) 27 يناير 2025

هناك جانب سلبي إلى R1. كونه نموذجًا صينيًا ، فهو يخضع لقياس منظم الإنترنت في الصين لضمان أن “استجاباتها” تجسد القيم الاشتراكية الأساسية “. لن يجيب R1 على أسئلة حول ميدان Tiananmen ، على سبيل المثال ، أو استقلالية تايوان.

تصفية R1 في العمل. ائتمانات الصورة:ديبسيك

ترفض العديد من أنظمة الذكاء الاصطناعى الصيني ، بما في ذلك نماذج التفكير الأخرى ، الاستجابة للمواضيع التي قد تثير غضب المنظمين في البلاد ، مثل التكهنات حول نظام الحادي عشر جينج.

يصل R1 بعد أيام من اقتراح إدارة بايدن المنتهية ولايته قواعد التصدير القاسية والقيود المفروضة على تقنيات الذكاء الاصطناعي للمشاريع الصينية. تم منع الشركات في الصين بالفعل من شراء رقائق الذكاء الاصطناعى المتقدمة ، ولكن إذا دخلت القواعد الجديدة حيز التنفيذ كما هو مكتوب ، فستواجه الشركات قبعات أكثر صرامة على كل من تقنية أشباه الموصلات والموديلات اللازمة لتمهيد أنظمة الذكاء الاصطناعي المتطورة.

في وثيقة السياسة الأسبوع الماضي ، حث Openai حكومة الولايات المتحدة على دعم تطوير الذكاء الاصطناعي الأمريكي ، خشية أن تطابق النماذج الصينية أو تتجاوزها في القدرة. في مقابلة مع المعلومات ، قام نائب الرئيس لسياسة Openai كريس ليهان بتصميم High Flyer Capital Management ، والوالد المؤسسي لـ Deepseek ، باعتباره منظمة ذات أهمية خاصة.

حتى الآن ، أنتجت ما لا يقل عن ثلاثة مختبرات صينية – Deepseek و Alibaba و Kimi ، المملوكة لشركة Unicorn Moonshot AI – نماذج يدعونها منافسة O1. (تجدر الإشارة إلى أن ديبسيك كان الأول – أعلنت عن معاينة R1 في أواخر نوفمبر). أتباع سريعين. “

“الأداء المثير للإعجاب لنماذج ديبسيك المقطرة […] كتب بول ، “بعيدًا عن عيون أي نظام تحكم من أعلى إلى أسفل” ، يعني أن العقلانيين القادرين للغاية سيستمرون في الانتشار على نطاق واسع وسيتم تشغيله على الأجهزة المحلية “.

نشرت هذه القصة في الأصل في 20 يناير وتم تحديثها في 27 يناير مع مزيد من المعلومات.

لدى TechCrunch رسالة إخبارية تركز على الذكاء الاصطناعي! اشترك هنا للحصول عليه في صندوق الوارد الخاص بك كل يوم أربعاء.

المصدر