فازت Gemini من Google على Pokémon Blue (مع القليل من المساعدة)

يبدو أن أغلى طراز من الذكاء الاصطناعي في Google قد تجاوز علامة بارزة: التغلب على لعبة فيديو عمرها 29 عامًا.
الليلة الماضية ، نشر الرئيس التنفيذي لشركة Google Sundar Pichai انتصارًا على X ، “يا له من النهاية! Gemini 2.5 Pro أكمل للتو Pokémon Blue!”
لكي نكون واضحين ، تم إنشاء Gemini Plays Pokemon Livestream بواسطة (بكلماته الخاصة) “مهندس برمجيات يبلغ من العمر 30 عامًا لا ينضج مع Google” الذي يذهب بواسطة جويل ز.
على سبيل المثال ، تم نشر Logan Kilpatrick ، الرصاص المنتج لـ Google AI Studio ، في الشهر الماضي أن Gemini كان “يحقق تقدمًا كبيرًا في إكمال Pokémon” و “حصل على شجاعه الخامس (أفضل نموذج له فقط 3 حتى الآن ، على الرغم من وجود عميل مختلف) ،” نقود Pichai إلى المزاح ، “نحن نعمل على API ، وبين Pokémon Interfination 🙂
لماذا بوكيمون؟ في فبراير / شباط ، أبرزت الأنثروبور التقدم الذي حققه نماذج Claude AI في “Pokémon Red” ، حيث كتب أن “التفكير الموسع والتدريب على الوكيل” لكلود يمنحها “دفعة كبيرة” في المهام “غير المتوقعة” ، مثل لعب لعبة كلاسيكية. (“Pokémon Red” و “Blue” هي إصدارات مختلفة من عنوان Gameboy الذي تم إصداره لأول مرة في عام 1996 وربط بامتياز Pokémon طويل الأمد). حتى أن هناك كلود يلعب قناة بوكيمون تيتش التي استشهد بها جويل زي كمصدر إلهام.
على الرغم من تقدمه ، لا يبدو أن كلود قد تغلب على “بوكيمون ريد” حتى الآن. هل هذا يعني أن الجوزاء أفضل بشكل موضوعي في اللعبة؟ على صفحته Twitch ، حث Joel Z للمشاهدين ، “من فضلك لا تعتبر هذا المعيار لمعرفة مدى جودة LLM للعب البوكيمون. لا يمكنك إجراء مقارنات مباشرة – لدى Gemini و كلود أدوات مختلفة وتلقي معلومات مختلفة.”
ويحتاج كلا طرازين الذكاء الاصطناعى إلى مساعدة في لعب اللعبة – حيث يأتي تسخير الوكيل المذكور أعلاه ، مما يوفر للموديلات مع لقطات شاشة للعبة تراكب معلومات إضافية ، مما يسمح للنموذج بتحديد كيفية الاستجابة (والتي قد تتضمن استدعاء وكلاء متخصصة) ، ثم الضغط على الزر الذي يتوافق مع تعليمات الذكاء الاصطناعى.
حدث TechCrunch
بيركلي ، كاليفورنيا
|
5 يونيو
كتاب الآن
اعترف جويل زي بوجود “تدخلات ديف” أخرى لمساعدة الجوزاء على إكمال اللعبة ، لكنه أصر على أنها ليست غشًا.
يقول: “إن تدخلاتي تعمل على تحسين قدرات الجوزاء في اتخاذ القرارات وقدرات التفكير”. “لا أعطي تلميحات محددة – لا توجد تجول أو تعليمات مباشرة لتحديات معينة مثل جبل مون. الشيء الوحيد الذي يقترب حتى هو السماح للجوزاء بمعرفة أنه يحتاج إلى التحدث إلى نخر الصاروخ مرتين للحصول على مفتاح الرفع ، والذي كان خطأ تم إصلاحه لاحقًا باللون الأصفر.”
بالإضافة إلى ذلك ، قال: “لا يزال الجوزاء يلعب بوكيمون يجري تطويره بنشاط ، ويستمر الإطار في التطور”.
اكتشاف المزيد من اشراق اون لاين
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.