يتفوق طراز AI2 الجديد من الذكاء الاصطناعي على طرازات متشابهة الحجم من Google ، Meta

eshrag منذ 5 ساعات

0 3 2 دقائق

يتفوق طراز AI2 الجديد من الذكاء الاصطناعي على طرازات متشابهة الحجم من Google ، Meta

يبدو أن الأسبوع لنماذج الذكاء الاصطناعى الصغيرة ، على ما يبدو.

في يوم الخميس ، أصدر AI2 ، المعهد غير الربحي لمنظمة العفو الدولية ، OLMO 2 1B ، وهو نموذج معلم البليون الذي يدعي AI2 يتفوق على نماذج متشابهة من Google و Meta و Alibaba على عدة معايير. المعلمات ، التي يشار إليها أحيانًا باسم الأوزان ، هي المكونات الداخلية للنموذج الذي يوجه سلوكه.

يتوفر Olmo 2 1B بموجب ترخيص Apache 2.0 متسامح على منصة AI Dev التي تعانق وجهها. على عكس معظم الطرز ، يمكن تكرار OLMO 2 1B من الصفر ؛ قدمت AI2 مجموعات الكود ومجموعات البيانات (OLMO-MIX-1124 ، Dolmino-MIX-1124) المستخدمة لتطويرها.

قد لا تكون النماذج الصغيرة قادرة على قدرتها على العمل ، ولكن من المهم ، أنها لا تتطلب تشغيل أجهزة سمين. وهذا يجعلهم أكثر سهولة للمطورين والهواة الذين يتنافسون مع قيود آلات المستهلك المنخفضة والمستهلكين.

كان هناك مجموعة من الأزياء الصغيرة على مدار الأيام القليلة الماضية ، من عائلة Microsoft PHI 4 المنطقية إلى Qwen’s 2.5 Omni 3B. يمكن أن تعمل معظم هذه – و OLMO 2 1B – بسهولة على جهاز كمبيوتر محمول حديث أو حتى جهاز محمول.

يقول AI2 أن OLMO 2 1B تم تدريبه على مجموعة بيانات من 4 تريليونات رمز من مصادر متوفرة للجمهور ، وتوليد الذكاء الاصطناعى ، والمصدر يدويًا. الرموز هي البتات الخام من نماذج البيانات التي تستهلك وتولد – مليون رمز تعادل حوالي 750،000 كلمة.

في القياس القياسي لقياس التفكير الحسابي ، GSM8K و OLMO 2 1B أفضل من Google Gemma 3 1B و Meta’s Llama 3.2 1B و Alibaba’s Qwen 2.5 1.5b. Olmo 2 1B يتفوق أيضًا على أداء تلك النماذج الثلاثة على realterfulqa ، وهو اختبار لتقييم الدقة الواقعية.

حدث TechCrunch

بيركلي ، كاليفورنيا
|
5 يونيو

كتاب الآن

تم تدريب هذا النموذج على رموز 4T من البيانات عالية الجودة ، في أعقاب نفس المعيار في الصلب عالي الجودة لنماذجنا 7 و 13 و 32B. نقوم بتحميل نقاط التفتيش الوسيطة من كل 1000 خطوة في التدريب.

الوصول إلى النموذج الأساسي: https://t.co/xofywjmo85 pic.twitter.com/7usj6symdl

– AI2 (allen_ai) 1 مايو 2025

يحذر AI2 من أن Olmo 2 1B يحمل المخاطر. مثل جميع نماذج الذكاء الاصطناعى ، يمكن أن تنتج “مخرجات إشكالية” بما في ذلك المحتوى الضار والذات “الحساسة” ، كما تقول المؤسسة ، بالإضافة إلى بيانات غير دقيقة في الواقع. لهذه الأسباب ، توصي AI2 ضد نشر OLMO 2 1B في الإعدادات التجارية.

المصدر