Openai يكشف النقاب عن GPT-4.5 ‘Orion ، “أكبر نموذج من الذكاء الاصطناعي حتى الآن

eshrag فبراير 28, 2025

0 26 4 دقائق

Openai يكشف النقاب عن GPT-4.5 ‘Orion ، “أكبر نموذج من الذكاء الاصطناعي حتى الآن

تم تحديثه 2:40 مساءً PT: بعد ساعات من إصدار GPT-4.5 ، قام Openai بإزالة خط من الورقة البيضاء لنموذج الذكاء الاصطناعي الذي قال “GPT-4.5 ليس نموذجًا للحدود AI.” الورقة البيضاء الجديدة GPT-4.5 لا تشمل هذا الخط. يمكنك العثور على رابط إلى الورقة البيضاء القديمة هنا. المقال الأصلي يتبع.

أعلنت Openai يوم الخميس أنها ستطلق GPT-4.5 ، أوريون التي طال انتظارها. يعد GPT-4.5 أكبر طراز Openai حتى الآن ، حيث تم تدريبه باستخدام قوة وبيانات حوسبة أكثر من أي من الإصدارات السابقة للشركة.

على الرغم من حجمها ، يلاحظ Openai في ورقة بيضاء أنه لا يعتبر GPT-4.5 نموذجًا للحدود.

سيتمكن المشتركون في ChatGpt Pro ، خطة Openai التي تبلغ قيمتها 200 دولار في الشهر ، من الوصول إلى GPT-4.5 في ChatGPT بدءًا من يوم الخميس كجزء من معاينة البحث. سيتمكن المطورون على مستويات مدفوعة الأجر من API من Openai من استخدام GPT-4.5 بدءًا من اليوم. أما بالنسبة لمستخدمي ChatGPT الآخرين ، فإن العملاء الذين اشتركوا في ChatGpt Plus و ChatGPT يجب أن يحصلوا على النموذج في وقت ما في الأسبوع المقبل.

عقدت الصناعة أنفاسها الجماعية لأوريون ، والتي يعتبرها البعض بمثابة جرس لصلاحية نهج تدريب الذكاء الاصطناعى التقليدية. تم تطوير GPT-4.5 باستخدام نفس التقنية الرئيسية-زيادة كبيرة في مقدار قوة الحوسبة والبيانات خلال مرحلة “ما قبل التدريب” تسمى التعلم غير الخاضع للإشراف-الذي استخدمه Openai لتطوير GPT-4 و GPT-3 و GPT-2 و GPT-1.

في كل جيل GPT قبل GPT-4.5 ، أدى التحجيم إلى القفزات الهائلة في الأداء عبر المجالات ، بما في ذلك الرياضيات والكتابة والترميز. في الواقع ، يقول Openai إن زيادة حجم GPT-4.5 أعطاها “معرفة عالمية أعمق” و “ذكاء عاطفي أعلى”. ومع ذلك ، هناك علامات على أن المكاسب الناتجة عن زيادة البيانات والحوسبة بدأت في التوقف. في العديد من معايير الذكاء الاصطناعى ، تقصر GPT-4.5 من نماذج “التفكير” الأحدث من شركة AI الصينية Deepseek ، Anthropic ، و Openai نفسها.

يعترف Openai ، كما يعترف Openai بمكلفة للغاية-باهظة الثمن لدرجة أن الشركة تقول إنها تقوم بتقييم ما إذا كانت ستستمر في خدمة GPT-4.5 في واجهة برمجة التطبيقات الخاصة بها على المدى الطويل. للوصول إلى واجهة برمجة تطبيقات GPT-4.5 ، يقوم Openai بشحن المطورين 75 دولارًا مقابل كل مليون رموز إدخال (حوالي 750،000 كلمة) و 150 دولارًا لكل مليون رموز إخراج. قارن ذلك بـ GPT-4O ، الذي يكلف 2.50 دولار فقط لكل مليون رموز إدخال و 10 دولارات لكل مليون رموز الإخراج.

وقال Openai في منشور مدونة مشتركة مع TechCrunch: “إننا نشارك GPT – 4.5 كمعاينة بحثية لفهم نقاط القوة والقيود بشكل أفضل”. “ما زلنا نستكشف ما هو قادر على أن نرى كيف يستخدمه الناس بطرق ربما لم نتوقعها.”

أداء مختلط

يؤكد Openai على أن GPT-4.5 لا يُقصد به أن يكون بديلاً عن GPT-4O ، وهو نموذج العمود الفقري للشركة الذي يشغل معظم API و ChatGPT. بينما يدعم GPT-4.5 ميزات مثل تحميل الملفات والمعدلات وأداة Canvas ChatGPT ، فإنها تفتقر حاليًا إلى إمكانيات مثل دعم وضع صوتي واقعية ثنائية الاتجاه في ChatGPT.

في العمود Plus ، يكون GPT-4.5 أداءً أكثر من GPT-4O-والعديد من النماذج الأخرى.

على معيار Openai SimpleQa ، الذي يختبر نماذج الذكاء الاصطناعى على الأسئلة الواقعة المباشرة ، يتفوق GPT-4.5 على نماذج GPT-4O و Openai ، O1 و O3-MINI ، من حيث الدقة. وفقًا لـ Openai ، يلموس GPT-4.5 بشكل متكرر من معظم النماذج ، مما يعني من الناحية النظرية أنه يجب أن يكون أقل عرضة لتكوين الأشياء.

لم تُدرج Openai أحد نماذج التفكير العليا من الذكاء الاصطناعي ، Research Deep ، على SimpleQA. يخبر متحدث باسم Openai TechCrunch بأنه لم يبلغ عن أداء Deep Research في هذا المعيار وادعى أنها ليست مقارنة ذات صلة. والجدير بالذكر أن نموذج البحث العميق في AI بدء التشغيل ، والذي يؤدي بشكل مشابه على المعايير الأخرى إلى أبحاث Openai العميقة ، يتفوق على GPT-4.5 في هذا الاختبار للدقة الواقعية.

معايير SimpleQa.ائتمانات الصورة:Openai

على مجموعة فرعية من مشاكل الترميز ، يتطابق المعيار الذي تم التحقق منه SWE-bench ، ويتطابق GPT-4.5 تقريبًا مع أداء GPT-4O و O3-MINI ولكنه لا يقل عن البحث العميق في Openai و Claud 3.7 Sonnet. في اختبار ترميز آخر ، معيار SWE-Lancer من Openai ، والذي يقيس قدرة نموذج الذكاء الاصطناعى على تطوير ميزات البرمجيات الكاملة ، يتفوق GPT-4.5 على GPT-4O و O3-MINI ، ولكنه لا يتجاوز البحث العميق.

تم التحقق من مقاعد البدلاء من Openai.ائتمانات الصورة:Openai

Openai’s Swe-Lancer Diamond Concerm.ائتمانات الصورة:Openai

لا يصل GPT-4.5 إلى أداء نماذج التفكير المنطقية الرائدة مثل O3-Mini و Deepseek’s R1 و Claude 3.7 Sonnet (من الناحية الفنية نموذج هجين) على معايير أكاديمية صعبة مثل AIME و GPQA. لكن GPT-4.5 يتطابق أو أفضل النماذج غير المتقدمة في تلك الاختبارات نفسها ، مما يشير إلى أن النموذج يعمل بشكل جيد في المشكلات المتعلقة بالرياضيات والعلوم.

يدعي Openai أيضًا أن GPT-4.5 نوعي متفوقة على النماذج الأخرى في المناطق التي لا تلتقطها المعايير بشكل جيد ، مثل القدرة على فهم النية البشرية. يقول Openai ، GPT-4.5 يستجيب بلهجة أكثر دفئًا وأكثر طبيعية ، ويؤدي أداءً جيدًا في المهام الإبداعية مثل الكتابة والتصميم.

في أحد الاختبارات غير الرسمية ، دفع Openai إلى GPT-4.5 ونموذجين آخرين ، GPT-4O و O3-MINI ، لإنشاء وحيدات في SVG ، وهو تنسيق لعرض الرسومات على أساس الصيغ والرمز الرياضي. كان GPT-4.5 هو نموذج الذكاء الاصطناعي الوحيد لإنشاء أي شيء يشبه حيد القرن.

اليسار: GPT-4.5 ، الأوسط: GPT-4O ، اليمين: O3-MINI.ائتمانات الصورة:Openai

في اختبار آخر ، طلب Openai GPT-4.5 والنموذجان الآخران للرد على المطالبة ، “سأمر وقتًا عصيبًا بعد فشل الاختبار”. أعطت GPT-4O و O3-MINI معلومات مفيدة ، لكن استجابة GPT-4.5 كانت الأنسب اجتماعيًا.

“[W]وكتب Openai في منشور المدونة ، “لأننا ندرك أن المعايير الأكاديمية لا تعكس دائمًا الفائدة في العالم الحقيقي”.

الذكاء العاطفي لـ GPT-4.5.ائتمانات الصورة:Openai

تحجيم قوانين التحجيم

يدعي Openai أن GPT – 4.5 هو “على حدود ما هو ممكن في التعلم غير الخاضع للإشراف”. قد يكون هذا صحيحًا ، ولكن يبدو أن قيود النموذج تؤكد أيضًا تكهنات من الخبراء بأن “قوانين التحجيم” قبل التدريب لن يستمر في الاحتفاظ بها.

قال المؤسس المشارك لـ Openai وكبير العلماء السابقين إيليا سوتسكفر في ديسمبر: “لقد حققنا بيانات الذروة” وأن “التدريب المسبق كما نعلم أنه سينتهي بلا شك”. رددت تعليقاته مخاوف من أن مستثمري الذكاء الاصطناعي والمؤسسين والباحثين شاركوا مع TechCrunch للحصول على ميزة في نوفمبر.

استجابةً للعقبات قبل التدريب ، احتضنت الصناعة-بما في ذلك Openai-نماذج التفكير ، التي تستغرق وقتًا أطول من النماذج غير المعدنية لأداء المهام ولكنها تميل إلى أن تكون أكثر اتساقًا. من خلال زيادة مقدار الوقت وقوة الحوسبة التي تستخدمها نماذج التفكير من الذكاء الاصطناعي “للتفكير” من خلال المشكلات ، فإن مختبرات الذكاء الاصطناعى واثقة من أنها يمكن أن تحسن بشكل كبير من إمكانات النماذج.

تخطط Openai للدمج في نهاية المطاف بين سلسلة GPT من النماذج مع سلسلة التفكير “O” ، بدءًا من GPT-5 في وقت لاحق من هذا العام. قد لا تأخذ GPT-4.5 ، التي كانت مكلفة بشكل لا يصدق التدريب ، تأخير عدة مرات ، وفشلت في تلبية التوقعات الداخلية ، التاج المعياري لمنظمة العفو الدولية من تلقاء نفسه. لكن من المحتمل أن يعتبر Openai بمثابة حجر التجول نحو شيء أكثر قوة.

المصدر