استخدمت الأنثروبري بوكيمون لقياس أحدث طراز من الذكاء الاصطناعي

eshrag فبراير 24, 2025

0 19 دقيقة واحدة

استخدمت الأنثروبري بوكيمون لقياس أحدث طراز من الذكاء الاصطناعي

استخدمت الأنثروبور بوكيمون لقياس أحدث طراز من الذكاء الاصطناعي. نعم حقا.

في منشور مدونة نُشر يوم الاثنين ، قالت الأنثروبور إنها اختبرت أحدث طراز لها ، Claude 3.7 Sonnet ، على لعبة Boy Boy Classic Pokémon Red. قامت الشركة بتجهيز النموذج بالذاكرة الأساسية ، وإدخال بكسل الشاشة ، ومكالمات الوظائف للضغط على الأزرار والتنقل حول الشاشة ، مما يتيح له تشغيل Pokémon بشكل مستمر.

تتمثل ميزة فريدة من نوعها في Claude 3.7 Sonnet في قدرتها على الانخراط في “التفكير الموسع”. مثل Openai’s O3-Mini و Deepseek’s R1 ، يمكن لـ Claude 3.7 Sonnet “التفكير” من خلال المشكلات الصعبة من خلال تطبيق المزيد من الحوسبة-وأخذ المزيد من الوقت.

التي جاءت في متناول يدي في بوكيمون الأحمر ، على ما يبدو.

بالمقارنة مع نسخة سابقة من كلود ، كلود 3.0 سونيت ، الذي فشل في مغادرة المنزل في بلدة البليت حيث تبدأ القصة ، حارب كلود 3.7 Sonnet بثلاثة قادة بوكيمون للألعاب الرياضية وفازت شاراتهم.

ائتمانات الصورة:الإنسان

الآن ، ليس من الواضح مقدار الحوسبة المطلوبة لـ Claude 3.7 Sonnet للوصول إلى تلك المعالم – والمدة التي يستغرقها كل منها. قال الإنسان فقط إن النموذج أجرى 35000 إجراء للوصول إلى آخر قائد صالة الألعاب الرياضية ، تراجع.

بالتأكيد لن يمر وقت طويل قبل أن يكتشف بعض المطورين المغامرين.

Pokémon Red هو أكثر من معيار لعبة أكثر من أي شيء آخر. ومع ذلك ، هناك يكون تاريخ طويل من الألعاب المستخدمة لأغراض القياس من الذكاء الاصطناعي. في الأشهر القليلة الماضية وحدها ، ظهر عدد من التطبيقات والمنصات الجديدة لاختبار قدرات اللعب في الألعاب على الألقاب التي تتراوح من شارع المقاتلة إلى الصور.

المصدر