يحاول الباحثون في وجه المعانقة بناء نسخة أكثر انفتاحًا من نموذج “التفكير” من Deepseek

eshrag يناير 28, 2025

0 36 3 دقائق

يحاول الباحثون في وجه المعانقة بناء نسخة أكثر انفتاحًا من نموذج “التفكير” من Deepseek

بالكاد بعد أسبوع من إصدار Deepseek نموذج “التفكير” R1 – الذي أرسل الأسواق إلى حقل – يحاول الباحثون في Hugging Face تكرار النموذج من الصفر فيما يطلق عليه اسم “المعرفة المفتوحة”.

أطلقت Hugging Face Head للبحوث Leandro Von Werra والعديد من مهندسي الشركات Open-R1 ، وهو مشروع يسعى إلى إنشاء نسخة مكررة من R1 ومصدر مفتوح جميع مكوناته ، بما في ذلك البيانات المستخدمة لتدريبه.

قال المهندسون إنهم اضطروا إلى التصرف من خلال فلسفة إصدار “BLOK BOX” من Deepseek. من الناحية الفنية ، يكون R1 “مفتوحًا” من حيث أن النموذج مرخص له بشكل متسمين ، مما يعني أنه يمكن نشره إلى حد كبير دون قيود. ومع ذلك ، فإن R1 ليس “مصدرًا مفتوحًا” لأن العديد من الأدوات المستخدمة لبناءها محفوظة في الغموض. مثل العديد من شركات الذكاء الاصطناعى عالية ، فإن Deepseek يكره الكشف عن صلصةها السرية.

وقالت إيلي باكوتش ، أحد مهندسي الوجه المعانقة في مشروع Open-R1 ، لـ TechCrunch: “نموذج R1 مثير للإعجاب ، ولكن لا توجد مجموعة بيانات مفتوحة أو تفاصيل التجربة أو النماذج المتوسطة المتاحة ، مما يجعل النسخ المتماثل ومزيد من الأبحاث صعبة”. “بنية R1 الكاملة المفتوحة المصدر بالكامل لا تتعلق فقط بالشفافية-إنها تتعلق بإلغاء تأمين إمكاناتها.”

لا منفتح جدا

ديبسيك ، مختبر من الذكاء الاصطناعى الصيني الذي تموله جزئيًا من قبل صندوق تحوط كمي ، أصدر R1 الأسبوع الماضي. على عدد من المعايير ، يتطابق R1 – وحتى يتجاوز – أداء نموذج التفكير O1 من Openai.

نظرًا لكونه نموذجًا للتفكير ، فإن R1 يقوم بتقسيم الحقائق بشكل فعال ، مما يساعدها على تجنب بعض المزالق التي عادة ما تكون على النماذج. تستغرق نماذج التفكير وقتًا أطول قليلاً-عادةً ثوانٍ إلى دقائق أطول-للوصول إلى حلول مقارنة بنموذج غير نموذجي. الاتجاه الصعودي هو أنهم يميلون إلى أن يكونوا أكثر موثوقية في المجالات مثل الفيزياء والعلوم والرياضيات.

اقتحم R1 الوعي السائد بعد أن ارتفع تطبيق Deepseek’s chatbot ، والذي يوفر وصولًا مجانيًا إلى R1 ، إلى أعلى مخططات متجر Apple App Store. إن السرعة والكفاءة التي تم تطوير R1 – أصدرت Deepseek النموذج بعد أسابيع فقط من إصدار Openai O1 – قادت العديد من محللي وول ستريت التقنيين إلى التساؤل عما إذا كانت الولايات المتحدة يمكنها الحفاظ على تقدمها في سباق الذكاء الاصطناعي.

وقال باكوتش لـ TechCrunch: “إن مشروع Open-R1 أقل قلقًا بشأن هيمنة AI من الولايات المتحدة من” فتح الصندوق الأسود للتدريب النموذجي بالكامل “. وأشار إلى أنه نظرًا لأن R1 لم يتم إصداره باستخدام رمز التدريب أو تعليمات التدريب ، فمن الصعب دراسة النموذج بعمق – أقل بكثير من توجيه سلوكه.

وقال باكوتش: “إن التحكم في مجموعة البيانات والعملية أمر بالغ الأهمية لنشر نموذج بمسؤولية في المناطق الحساسة”. كما أنه يساعد في فهم ومعالجة التحيزات في النموذج. يتطلب الباحثون أكثر من شظايا […] لدفع حدود ما هو ممكن. “

خطوات للتكرار

الهدف من مشروع Open-R1 هو تكرار R1 في غضون أسابيع قليلة ، والاعتماد جزئيًا على العناق العلمي في Face ، وهو خادم أبحاث مخصص مع 768 NVIDIA H100 GPU.

يخطط مهندسو الوجه المعانقة للاستفادة من مجموعة العلوم لإنشاء مجموعات بيانات مماثلة لتلك العميقة المستخدمة لإنشاء R1. لبناء خط أنابيب تدريب ، يقوم الفريق بطلب المساعدة من AI ومجتمعات التكنولوجيا الأوسع على معانقة الوجه وجيثوب ، حيث يتم استضافة مشروع Open-R1.

“نحن بحاجة إلى التأكد من تنفيذ الخوارزميات والوصفات [correctly,]”أخبر فون ويرا TechCrunch ،” لكنه شيء هو جهد مجتمعي مثالي في معالجته ، حيث تحصل على أكبر عدد ممكن من العيون على المشكلة. “

هناك الكثير من الاهتمام بالفعل. حقق مشروع Open-R1 10000 نجمة في ثلاثة أيام فقط على جيثب. النجوم هي وسيلة لمستخدمي GitHub للإشارة إلى أنهم يحبون مشروعًا أو يجدونه مفيدًا.

إذا نجح مشروع Open-R1 ، فسيتمكن باحثو الذكاء الاصطناعى من البناء على قمة خط أنابيب التدريب والعمل على تطوير الجيل القادم من نماذج التفكير المفتوح المصدر. إنه يأمل ألا يؤدي مشروع Open-R1 فقط إلى تكرار قوي مفتوح المصدر لـ R1 ، ولكنه أساس لنماذج أفضل قادمة.

وقال باكوتش: “بدلاً من أن تكون لعبة صفرية ، فإن تطوير المصدر المفتوح يفيد الجميع على الفور ، بما في ذلك مختبرات الحدود ومقدمي النماذج ، حيث يمكنهم جميعًا استخدام نفس الابتكارات”.

في حين أن بعض خبراء الذكاء الاصطناعى أثاروا مخاوف بشأن احتمال إساءة معاملة AI مفتوحة المصدر ، يعتقد Bakouch أن الفوائد تفوق المخاطر.

وقال: “عندما يتم تكرار وصفة R1 ، يمكن لأي شخص يمكنه استئجار بعض وحدات معالجة الرسومات بناء متغيره الخاص بـ R1 مع بياناته الخاصة ، مما يزيد من انتشار التكنولوجيا في كل مكان”. “نحن متحمسون حقًا للإصدارات الحديثة المصدر المفتوحة التي تعزز دور الانفتاح في الذكاء الاصطناعي. إنه تحول مهم في هذا المجال الذي يغير السرد بأن حفنة من المختبرات فقط قادرون على إحراز تقدم ، وأن المصدر المفتوح يتخلف عن الركب. “

المصدر