يتفوق طراز AI2 الجديد من الذكاء الاصطناعي على طرازات متشابهة الحجم من Google ، Meta

يبدو أن الأسبوع لنماذج الذكاء الاصطناعى الصغيرة ، على ما يبدو.
في يوم الخميس ، أصدر AI2 ، المعهد غير الربحي لمنظمة العفو الدولية ، OLMO 2 1B ، وهو نموذج معلم البليون الذي يدعي AI2 يتفوق على نماذج متشابهة من Google و Meta و Alibaba على عدة معايير. المعلمات ، التي يشار إليها أحيانًا باسم الأوزان ، هي المكونات الداخلية للنموذج الذي يوجه سلوكه.
يتوفر Olmo 2 1B بموجب ترخيص Apache 2.0 متسامح على منصة AI Dev التي تعانق وجهها. على عكس معظم الطرز ، يمكن تكرار OLMO 2 1B من الصفر ؛ قدمت AI2 مجموعات الكود ومجموعات البيانات (OLMO-MIX-1124 ، Dolmino-MIX-1124) المستخدمة لتطويرها.
قد لا تكون النماذج الصغيرة قادرة على قدرتها على العمل ، ولكن من المهم ، أنها لا تتطلب تشغيل أجهزة سمين. وهذا يجعلهم أكثر سهولة للمطورين والهواة الذين يتنافسون مع قيود آلات المستهلك المنخفضة والمستهلكين.
كان هناك مجموعة من الأزياء الصغيرة على مدار الأيام القليلة الماضية ، من عائلة Microsoft PHI 4 المنطقية إلى Qwen’s 2.5 Omni 3B. يمكن أن تعمل معظم هذه – و OLMO 2 1B – بسهولة على جهاز كمبيوتر محمول حديث أو حتى جهاز محمول.
يقول AI2 أن OLMO 2 1B تم تدريبه على مجموعة بيانات من 4 تريليونات رمز من مصادر متوفرة للجمهور ، وتوليد الذكاء الاصطناعى ، والمصدر يدويًا. الرموز هي البتات الخام من نماذج البيانات التي تستهلك وتولد – مليون رمز تعادل حوالي 750،000 كلمة.
في القياس القياسي لقياس التفكير الحسابي ، GSM8K و OLMO 2 1B أفضل من Google Gemma 3 1B و Meta’s Llama 3.2 1B و Alibaba’s Qwen 2.5 1.5b. Olmo 2 1B يتفوق أيضًا على أداء تلك النماذج الثلاثة على realterfulqa ، وهو اختبار لتقييم الدقة الواقعية.
حدث TechCrunch
بيركلي ، كاليفورنيا
|
5 يونيو
كتاب الآن
يحذر AI2 من أن Olmo 2 1B يحمل المخاطر. مثل جميع نماذج الذكاء الاصطناعى ، يمكن أن تنتج “مخرجات إشكالية” بما في ذلك المحتوى الضار والذات “الحساسة” ، كما تقول المؤسسة ، بالإضافة إلى بيانات غير دقيقة في الواقع. لهذه الأسباب ، توصي AI2 ضد نشر OLMO 2 1B في الإعدادات التجارية.
اكتشاف المزيد من اشراق اون لاين
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.