حتى بعض أفضل الذكاء الاصطناعي لا يمكنه التغلب على هذا المعيار الجديد
أصدر مركز سلامة الذكاء الاصطناعي (CAIS) غير الربحي وشركة Scale AI، وهي شركة تقدم عددًا من خدمات تصنيف البيانات وتطوير الذكاء الاصطناعي، معيارًا جديدًا صعبًا لأنظمة الذكاء الاصطناعي الحدودية.
ويتضمن المعيار، الذي يطلق عليه “الاختبار الأخير للإنسانية”، آلاف الأسئلة الجماعية التي تتناول موضوعات مثل الرياضيات والعلوم الإنسانية والعلوم الطبيعية. ولجعل التقييم أكثر صرامة، تكون الأسئلة بتنسيقات متعددة، بما في ذلك التنسيقات التي تتضمن الرسوم البيانية والصور.
في دراسة أولية، لم ينجح أي نظام ذكاء اصطناعي رئيسي متاح للعامة في الحصول على نتيجة أفضل من 10% في الاختبار الأخير للبشرية.
يقول CAIS وScale AI إنهما يخططان لفتح المعيار أمام مجتمع البحث حتى يتمكن الباحثون من “التعمق أكثر في الاختلافات” وتقييم نماذج الذكاء الاصطناعي الجديدة.
اكتشاف المزيد من اشراق اون لاين
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.