يعهد Openai بإجراء تغييرات لمنع sycophancy chatgpt في المستقبل

eshrag منذ 13 ساعة

0 0 2 دقائق

يعهد Openai بإجراء تغييرات لمنع sycophancy chatgpt في المستقبل

يقول Openai إنه سيقوم بإجراء تغييرات على الطريقة التي يقوم بها بتحديث نماذج الذكاء الاصطناعى التي تدور حولها ، بعد حادثة تسببت في أن تصبح المنصة بشكل مفرط بالنسبة للعديد من المستخدمين.

في نهاية الأسبوع الماضي ، بعد أن قام Openai بطرح GPT-4O المعدلة-أشار المستخدمون الافتراضي الذي يعمل على تشغيل chatgpt-على وسائل التواصل الاجتماعي أن ChatGpt بدأ في الاستجابة بطريقة مفرطة في التحقق من صحة ومقبولة. سرعان ما أصبح ميمي. نشر المستخدمون لقطات شاشة من chatgpt يحيطون بجميع أنواع القرارات والأفكار الخطيرة.

في منشور في X يوم الأحد الماضي ، اعترف الرئيس التنفيذي سام التمان بالمشكلة وقال إن Openai سيعمل على إصلاحات “ASAP”. في يوم الثلاثاء ، أعلن Altman عن إعادة تحديث GPT-4O وأن Openai كان يعمل على “إصلاحات إضافية” لشخصية النموذج.

نشرت الشركة بعد الوفاة يوم الثلاثاء ، وفي مدونة منشور يوم الجمعة ، توسعت Openai على تعديلات محددة تخطط لإجراء عملية النشر النموذجية.

تقول Openai إنها تخطط لتقديم “مرحلة ألفا” لبعض النماذج التي من شأنها أن تسمح لبعض مستخدمي ChatGPT باختبار النماذج وتقديم التعليقات قبل الإطلاق. وتقول الشركة أيضًا إنها ستشمل تفسيرات “القيود المعروفة” للتحديثات المتزايدة المستقبلية للنماذج في ChatGPT ، وتعديل عملية مراجعة السلامة الخاصة بها للنظر رسميًا في مشكلات السلوك النموذجية “مثل الشخصية والخداع والموثوقية وهلوسة (على سبيل المثال ، عندما يقوم النموذج بزيادة الأمور) كمخاوف” لحظر الإطلاق “.

كتب Openai في منشور المدونة: “المضي قدمًا ، سنتواصل بشكل استباقي حول التحديثات التي نقدمها للنماذج في ChatGpt ، سواء كانت” خفية “أم لا”. “حتى لو لم تكن هذه المشكلات قابلة للقياس الكمي تمامًا اليوم ، فإننا نلتزم بحظر عمليات الإطلاق بناءً على قياسات الوكيل أو الإشارات النوعية ، حتى عندما تبدو المقاييس مثل اختبار A/B جيدًا.”

لقد فاتنا العلامة مع تحديث GPT-4O الأسبوع الماضي.

ماذا حدث ، ما تعلمناه ، وبعض الأشياء التي سنفعلها بشكل مختلف في المستقبل: https://t.co/er1gmryric

– سام التمان (sama) 2 مايو 2025

تأتي الإصلاحات المهددة عندما يلجأ المزيد من الأشخاص إلى ChatGpt للحصول على المشورة. وفقًا لاستطلاع واحد أجراه تمويلًا قانونيًا صريحًا من محامي الدعوى ، استخدم 60 ٪ من البالغين من الولايات المتحدة ChatGPT للبحث عن محام أو معلومات. يثير الاعتماد المتزايد على chatgpt – وقاعدة المستخدمين الهائلة للمنصة – المخاطر عندما تظهر مشكلات مثل sycophancy الشديد ، ناهيك عن الهلوسة وغيرها من أوجه القصور الفنية.

حدث TechCrunch

بيركلي ، كاليفورنيا
|
5 يونيو

كتاب الآن

كخطوة مخففة ، في وقت سابق من هذا الأسبوع ، قال Openai إنه سيختبر طرقًا للسماح للمستخدمين بتقديم “ملاحظات في الوقت الفعلي” “للتأثير المباشر على تفاعلاتهم” مع ChatGPT. قالت الشركة أيضًا إنها ستحقق التقنيات لتوجيه النماذج بعيدًا عن sycophancy ، وربما تسمح للأشخاص بالاختيار من بين شخصيات نموذجية متعددة في ChatGPT ، وبناء درابزين أمان إضافي ، وتوسيع التقييمات للمساعدة في تحديد القضايا التي تتجاوز sycophancy.

“أحد أكبر الدروس هو إدراك تمامًا كيف بدأ الناس في استخدام ChatGPT للحصول على نصيحة شخصية عميقة – وهو شيء لم نره حتى قبل عام” ، تابع Openai في منشور المدونة. “في ذلك الوقت ، لم يكن هذا محورًا أساسيًا ، ولكن مع تطور الذكاء الاصطناعي والمجتمع ، أصبح من الواضح أننا نحتاج إلى التعامل مع حالة الاستخدام هذه بعناية فائقة. سيكون الآن جزءًا أكثر جدوى من عمل السلامة لدينا.”

المصدر