يريد الرئيس التنفيذي لشركة أنثروبور فتح الصندوق الأسود لنماذج الذكاء الاصطناعى بحلول عام 2027

نشر الرئيس التنفيذي للأنثروبور داريو أمودي مقالًا يوم الخميس يسلط الضوء على مدى فهم الباحثين القليل عن الأعمال الداخلية لنماذج الذكاء الاصطناعى في العالم. لمعالجة ذلك ، حدد Amodei هدفًا طموحًا لأنثروبور لاكتشاف معظم مشاكل نموذج الذكاء الاصطناعى بحلول عام 2027.
يعترف Amodei بالتحدي المقبل. في “إلحاح القابلية للتفسير” ، يقول الرئيس التنفيذي لشركة أنثروبور إن الأنثروبور حقق اختراقات مبكرة في تتبع كيفية وصول النماذج إلى إجاباتها – ولكنها تؤكد أن هناك حاجة إلى مزيد من البحث لفك تشفير هذه الأنظمة مع نموها أكثر قوة.
“أنا قلق للغاية بشأن نشر مثل هذه الأنظمة دون التعامل بشكل أفضل على القابلية للتفسير” ، كتب Amodei في المقال. “ستكون هذه الأنظمة أساسية تمامًا للاقتصاد والتكنولوجيا والأمن القومي ، وستكون قادرة على الكثير من الحكم الذاتي لدرجة أنني أعتبر أنه من غير المقبول أساسًا أن تكون الإنسانية جاهلة تمامًا لكيفية عملها”.
الأنثروبور هي واحدة من الشركات الرائدة في التفسير الميكانيكي ، وهو مجال يهدف إلى فتح المربع الأسود لنماذج الذكاء الاصطناعى وفهم سبب اتخاذ القرارات التي يقومون بها. على الرغم من التحسينات السريعة في الأداء في نماذج الذكاء الاصطناعى في صناعة التكنولوجيا ، لا يزال لدينا فكرة ضئيلة نسبيًا كيف تصل هذه الأنظمة إلى القرارات.
على سبيل المثال ، أطلقت Openai مؤخرًا نماذج AI Reativeing الجديدة ، O3 و O4-MINI ، والتي تعمل بشكل أفضل في بعض المهام ، ولكن أيضًا هلوسة أكثر من نماذجها الأخرى. لا تعرف الشركة سبب حدوثها.
“عندما يفعل نظام الذكاء الاصطناعى التوليدي شيئًا ، مثل تلخيص وثيقة مالية ، ليس لدينا أي فكرة ، على مستوى محدد أو دقيق ، ولماذا يتخذ الخيارات التي يقوم بها – لماذا يختار كلمات معينة على الآخرين ، أو لماذا يرتكب خطأ في بعض الأحيان على الرغم من أن يكون دقيقًا عادةً”.
في المقال ، يلاحظ Amodei أن المؤسس المشارك للأنثروبور كريس أولا يقول أن نماذج الذكاء الاصطناعى “تزرع أكثر مما تم بناؤها”. بمعنى آخر ، وجد باحثو الذكاء الاصطناعي طرقًا لتحسين ذكاء نموذج الذكاء الاصطناعي ، لكنهم لا يعرفون السبب تمامًا.
في المقال ، يقول Amodei إنه قد يكون من الخطورة الوصول إلى AGI – أو كما يسميها ، “بلد من العباقرة في مركز البيانات” – دون فهم كيفية عمل هذه النماذج. في مقال سابق ، ادعى Amodei أن صناعة التكنولوجيا يمكن أن تصل إلى مثل هذا المعلم بحلول عام 2026 أو 2027 ، ولكنه يعتقد أننا في حالة أبعد من فهم نماذج الذكاء الاصطناعى هذه تمامًا.
على المدى الطويل ، يقول Amodei إن الأنثروبور تود ، في الأساس ، إجراء “فحوصات في الدماغ” أو “التصوير بالرنين المغناطيسي” لنماذج AI الحديثة. من شأن هذه الفحوصات أن تساعد في تحديد مجموعة واسعة من المشكلات في نماذج الذكاء الاصطناعى ، بما في ذلك ميولها للكذب أو البحث عن السلطة ، أو ضعف أي ضعف ، كما يقول. وأضاف أن هذا قد يستغرق من خمس إلى 10 سنوات لتحقيقه ، لكن هذه التدابير ستكون ضرورية لاختبار ونشر نماذج الذكاء الاصطناعي في الأنثروبور.
لقد جعلت الأنثروبور بعض الاختراقات البحثية التي سمحت لها بفهم أفضل لكيفية عمل نماذج الذكاء الاصطناعى. على سبيل المثال ، وجدت الشركة مؤخرًا طرقًا لتتبع مسارات التفكير في نموذج الذكاء الاصطناعي ، وما تسميه الشركة ، والدوائر. حددت الأنثروبور دائرة واحدة تساعد نماذج الذكاء الاصطناعي على فهم المدن الأمريكية التي تقع فيها الولايات المتحدة. لم تجد الشركة سوى عدد قليل من هذه الدوائر ولكن التقديرات هناك الملايين ضمن نماذج الذكاء الاصطناعى.
كانت الأنثروبور تستثمر في أبحاث التفسير نفسها ، وقد استثمرت مؤخرًا أول استثماراتها في شركة ناشئة تعمل على التفسير. على الرغم من أن التفسير يُنظر إليه إلى حد كبير على أنه مجال لأبحاث السلامة اليوم ، إلا أن Amodei يلاحظ أنه في النهاية ، يشرح كيفية وصول نماذج الذكاء الاصطناعى إلى إجاباتها ميزة تجارية.
في المقال ، دعا Amodei Openai و Google DeepMind لزيادة جهودها البحثية في هذا المجال. إلى جانب الدفعة الصديقة ، طلب الرئيس التنفيذي لشركة Anthropic الحكومات فرض لوائح “ملمس الضوء” لتشجيع أبحاث التفسير ، مثل متطلبات الشركات للكشف عن ممارسات السلامة والأمن. في المقال ، يقول Amodei أيضًا إنه يجب على الولايات المتحدة أن تضع ضوابط تصدير على الرقائق إلى الصين ، من أجل الحد من احتمال وجود سباق من الذكاء الاصطناعي خارج السيطرة.
لقد برزت الأنثروبور دائمًا من Openai و Google لتركيزها على السلامة. في حين أن شركات التكنولوجيا الأخرى دفعت إلى مشروع قانون السلامة المثير للجدل في كاليفورنيا ، SB 1047 ، أصدرت الأنثروبور دعمًا وتوصيات متواضعة لمشروع القانون ، والذي كان من شأنه أن يضع معايير الإبلاغ عن السلامة لمطوري طراز AI Frontier.
في هذه الحالة ، يبدو أن الأنثروبور تدفع من أجل جهد على مستوى الصناعة لفهم نماذج الذكاء الاصطناعى بشكل أفضل ، وليس فقط زيادة قدراتها.
اكتشاف المزيد من اشراق اون لاين
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.