تكشف Google عن عائلة من النماذج المنطقية من الذكاء الاصطناعي من الجيل التالي

eshrag مارس 26, 2025

0 18 2 دقائق

تكشف Google عن عائلة من النماذج المنطقية من الذكاء الاصطناعي من الجيل التالي

في يوم الثلاثاء ، كشفت Google عن Gemini 2.5 ، وهي عائلة جديدة من نماذج التفكير التي تتوقف عن “التفكير” قبل الإجابة على سؤال.

لبدء عائلة النماذج الجديدة ، تقوم Google بإطلاق Gemini 2.5 Pro التجريبي ، وهو نموذج منظمة العفو الدولية متعددة الوسائط ، التي تدعي الشركة أنها نموذجها الأكثر ذكاءً حتى الآن. سيكون هذا النموذج متاحًا يوم الثلاثاء في منصة مطور الشركة ، Google AI Studio ، وكذلك في تطبيق Gemini للمشتركين في خطة AI التي تبلغ 20 دولارًا في الشهر ، Gemini Advanced.

للمضي قدمًا ، تقول Google إن جميع طرز الذكاء الاصطناعى الجديدة ستحصل على إمكانيات تفكير.

منذ أن أطلقت Openai أول نموذج التفكير في AI في سبتمبر 2024 ، O1 ، تسابق صناعة التكنولوجيا لمطابقة أو تتجاوز قدرات هذا النموذج من خلالها. اليوم ، لدى كل من الأنثروبور و Deepseek و Google و Xai نماذج التفكير من الذكاء الاصطناعي ، والتي تستخدم قوة حوسبة إضافية ووقت للتحقق من الحقائق والعقل من خلال المشاكل قبل تقديم إجابة.

ساعدت تقنيات التفكير نماذج الذكاء الاصطناعي على تحقيق ارتفاعات جديدة في مهام الرياضيات والترميز. يعتقد الكثيرون في عالم التكنولوجيا أن نماذج التفكير ستكون مكونًا رئيسيًا لعوامل الذكاء الاصطناعي ، والأنظمة المستقلة التي يمكن أن تؤدي المهام إلى حد كبير دون التدخل البشري. ومع ذلك ، هذه النماذج هي أيضا أكثر تكلفة.

جربت Google نماذج التفكير من الذكاء الاصطناعى من قبل ، حيث تم إصدار إصدار “تفكير” من Gemini سابقًا في ديسمبر. لكن Gemini 2.5 يمثل أخطر محاولة للشركة حتى الآن في أفضل سلسلة من النماذج “O” من Openai.

تدعي Google أن Gemini 2.5 Pro يتفوق على نماذج AI الحدودية السابقة ، وبعض نماذج الذكاء الاصطناعى المتنافسة ، على عدة معايير. على وجه التحديد ، تقول Google إنها صممت Gemini 2.5 للتفوق على إنشاء تطبيقات ويب مقنعة بصريًا وتطبيقات الترميز الوكيل.

في إجراء تقييم لقياس رمز التقييم ، يسمى AIDER Polyglot ، تقول Google إن Gemini 2.5 Pro يسجل 68.6 ٪ ، يتفوق على أفضل طرز الذكاء الاصطناعي من Openai ، Anthropic ، و AI Lab Labesek.

ومع ذلك ، في اختبار آخر لقياس برنامج DEV ، تم التحقق من SWE-BENCED ، ويتميز Gemini 2.5 PRO بنسبة 63.8 ٪ ، يتفوق على Openai’s O3-MINI و DEEPSEEK’s R1 ، ولكن الأداء الضعيف Claude 3.7 Sonnet ، الذي سجل 70.3 ٪.

في امتحان الإنسانية الأخير ، اختبار متعدد الوسائط يتكون من الآلاف من الأسئلة الجماعية المتعلقة بالرياضيات والعلوم الإنسانية والعلوم الطبيعية ، تقول Google إن Gemini 2.5 PRO يسجل 18.8 ٪ ، أداء أفضل من معظم النماذج الرائدة المنافسة.

للبدء ، تقول Google إن Gemini 2.5 Pro يتم شحنها باستخدام نافذة سياق رمزي بقيمة مليون مليون ، مما يعني أن نموذج الذكاء الاصطناعي يمكن أن يأخذ ما يقرب من 750،000 كلمة في واحدة. هذا أطول من سلسلة كتب “Lord of the Rings” بأكملها. وقريباً ، ستدعم Gemini 2.5 Pro ضعف طول الإدخال (2 مليون رمز).

لم تنشر Google تسعير API لـ Gemini 2.5 Pro. تقول الشركة إنها ستشارك أكثر في الأسابيع المقبلة.

المصدر