تقنية

يشرح Openai لماذا أصبح Chatgpt sycophanty للغاية


نشر Openai بعد الوفاة حول قضايا sycophancy الأخيرة مع نموذج الذكاء الافتراضي الذي يعمل على تشغيل ChatGPT ، GPT-4O-القضايا التي أجبرت الشركة على إعادة تحديث إلى النموذج الذي صدر الأسبوع الماضي.

خلال عطلة نهاية الأسبوع ، بعد تحديث طراز GPT-4O ، أشار المستخدمون على وسائل التواصل الاجتماعي إلى أن ChatGPT بدأ في الاستجابة بطريقة مفرطة في التحقق من صحة ومقبولة. سرعان ما أصبح ميمي. نشر المستخدمون لقطات شاشة من chatgpt يحيطون بجميع أنواع القرارات والأفكار الخطيرة.

في منشور يوم الأحد يوم الأحد ، اعترف الرئيس التنفيذي سام ألمان بالمشكلة وقال إن Openai سيعمل على الإصلاحات “في أسرع وقت ممكن”. بعد يومين ، أعلنت Altman عن تراجع تحديث GPT-4O وأن Openai كان يعمل على “إصلاحات إضافية” لشخصية النموذج.

وفقًا لـ Openai ، تم إبلاغ التحديث ، الذي كان يهدف إلى جعل الشخصية الافتراضية للنموذج “أكثر سهولة وفعالية” ، أكثر من ذلك بكثير من خلال “ردود الفعل قصيرة الأجل” و “لم يفسر تمامًا كيف تتطور تفاعلات المستخدمين مع ChatGPT بمرور الوقت”.

كتب Openai في منشور مدونة: “نتيجة لذلك ، منحت GPT -4O نحو الاستجابات التي كانت داعمة للغاية ولكنها مخادع”. “يمكن أن تكون تفاعلات السيكوفانتيك غير مريحة ، ومثيرة للقلق ، وتسبب ضائقة. لقد قصرنا ونعمل على تصحيحه”.

تقول Openai إنها تقوم بتنفيذ العديد من الإصلاحات ، بما في ذلك تحسين تقنيات التدريب النموذجية الأساسية ومطالبات النظام بتوجيه GPT-4O بشكل صريح عن sycophancy. (مطالبات النظام هي الإرشادات الأولية التي توجه السلوك الشامل للنموذج ونغمتها في التفاعلات.) تقوم الشركة أيضًا ببناء المزيد من درابزين الأمان “لزيادة” [the model’s] الصدق والشفافية “، والاستمرار في توسيع تقييماتها” للمساعدة في تحديد القضايا التي تتجاوز sycophancy “، كما تقول.

يقول Openai أيضًا إنه يجرب طرقًا للسماح للمستخدمين بتقديم “ملاحظات في الوقت الفعلي” “للتأثير المباشر على تفاعلاتهم” مع ChatGPT والاختيار من بين شخصيات ChatGPT متعددة.

“[W]كتبت الشركة في منشور مدونتها: “نأمل أن تساعدنا التعليقات بشكل أفضل على تعكس بشكل أفضل قيمًا ثقافية متنوعة في جميع أنحاء العالم وفهم كيف ترغب في التطور ،” نأمل أن تساعدنا على تعكس أفضل لقيم ثقافية متنوعة في جميع أنحاء العالم وفهم كيف ترغب في التطور ، “نأمل أن تساعدنا التعليق بشكل أفضل في تعكس بشكل أفضل ، على أفضل […] نعتقد أيضًا أن المستخدمين يجب أن يكون لديهم المزيد من التحكم في كيفية تصرف ChatGPT ، وذلك إلى الحد الذي يكون فيه آمنًا وممكنًا ، إجراء تعديلات إذا لم يتفقوا مع السلوك الافتراضي. “





المصدر


اكتشاف المزيد من اشراق اون لاين

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من اشراق اون لاين

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading