كشفت ملفات المحكمة أن المديرين التنفيذيين في Meta مهووسون بالتغلب على GPT-4 الخاص بـ OpenAI داخليًا
كان المديرون التنفيذيون والباحثون الذين يقودون جهود Meta في الذكاء الاصطناعي مهووسين بالتغلب على نموذج GPT-4 الخاص بـ OpenAI أثناء تطوير Llama 3، وفقًا للرسائل الداخلية التي كشفت عنها المحكمة يوم الثلاثاء في إحدى قضايا حقوق الطبع والنشر المستمرة للشركة، Kadrey v. Meta.
“بصراحة… هدفنا يجب أن يكون GPT-4″، قال نائب الرئيس للذكاء الاصطناعي التوليدي في Meta، أحمد الدحل، في رسالة في أكتوبر 2023 إلى الباحث في Meta هوغو توفرون. “لدينا 64 ألف وحدة معالجة رسوميات قادمة! نحن بحاجة إلى أن نتعلم كيفية بناء الحدود والفوز بهذا السباق.
على الرغم من أن شركة Meta تطلق نماذج مفتوحة للذكاء الاصطناعي، إلا أن قادة الذكاء الاصطناعي في الشركة كانوا أكثر تركيزًا على التغلب على المنافسين الذين لا يطلقون عادةً أوزان نماذجهم، مثل Anthropic وOpenAI، وبدلاً من ذلك يقومون بربطها خلف واجهة برمجة التطبيقات. اعتبر المسؤولون التنفيذيون والباحثون في Meta أن Anthropic’s Claude وGPT-4 من OpenAI هو المعيار الذهبي للعمل من أجله.
تم ذكر شركة ميسترال الفرنسية الناشئة للذكاء الاصطناعي، وهي واحدة من أكبر المنافسين المفتوحين لشركة ميتا، عدة مرات في الرسائل الداخلية، لكن اللهجة كانت رافضة.
وقال الدحلة في رسالة “ميسترال هي حبة الفول السوداني بالنسبة لنا”. وقال في وقت لاحق: “يجب أن نكون قادرين على القيام بعمل أفضل”.
تتسابق شركات التكنولوجيا هذه الأيام للتفوق على بعضها البعض من خلال نماذج الذكاء الاصطناعي المتطورة، لكن ملفات المحكمة هذه تكشف مدى التنافسية الحقيقية التي كان يتمتع بها قادة الذكاء الاصطناعي في شركة Meta، وما زالوا كذلك على ما يبدو. في عدة نقاط من تبادل الرسائل، تحدث قادة الذكاء الاصطناعي في Meta عن مدى “شراستهم الشديدة” في الحصول على البيانات الصحيحة لتدريب اللاما؛ وفي مرحلة ما، قال أحد المسؤولين التنفيذيين في رسالة إلى زملاء العمل إن “Llama 3 هو كل ما أهتم به حرفيًا”.
يزعم المدعون في هذه القضية أن المديرين التنفيذيين لشركة ميتا يختصرون أحيانًا الطريق في سباقهم المجنون لشحن نماذج الذكاء الاصطناعي، والتدريب على الكتب المحمية بحقوق الطبع والنشر في هذه العملية.
أشار توفرون في رسالة إلى أن مزيج مجموعات البيانات المستخدمة في Llama 2 “كان سيئًا”، وتحدث عن كيفية استخدام Meta لمزيج أفضل من مصادر البيانات لتحسين Llama 3. ثم تحدث توفيرون والداهلي عن تمهيد الطريق للاستخدام مجموعة بيانات LibGen، التي تحتوي على أعمال محمية بحقوق الطبع والنشر من Cengage Learning وMacmillan Learning وMcGraw Hill وPearson Education.
“هل لدينا مجموعات البيانات الصحيحة هناك[?]قال الدحل. “هل هناك أي شيء تريد استخدامه ولكنك لا تستطيع ذلك لسبب غبي؟”
قال الرئيس التنفيذي لشركة Meta Mark Zuckerberg سابقًا إنه يحاول سد فجوة الأداء بين نماذج الذكاء الاصطناعي الخاصة بـ Llama والنماذج المغلقة من OpenAI وGoogle وغيرها. وتكشف الرسائل الداخلية عن الضغط الشديد داخل الشركة للقيام بذلك.
وقال زوكربيرج في رسالة بتاريخ يوليو 2024: “هذا العام، تتنافس Llama 3 مع النماذج الأكثر تقدمًا ورائدة في بعض المجالات. بدءًا من العام المقبل، نتوقع أن تصبح نماذج Llama المستقبلية هي الأكثر تقدمًا في الصناعة”.
عندما أصدرت Meta أخيرًا Llama 3 في أبريل 2024، كان نموذج الذكاء الاصطناعي المفتوح منافسًا للنماذج المغلقة الرائدة من Google وOpenAI وAnthropic، وتفوق على الخيارات المفتوحة من Mistral. ومع ذلك، فإن البيانات التي استخدمتها Meta لتدريب نماذجها – البيانات التي يُقال إن زوكربيرج أعطى الضوء الأخضر لاستخدامها، على الرغم من حالة حقوق النشر الخاصة بها – تواجه التدقيق في العديد من الدعاوى القضائية الجارية.
اكتشاف المزيد من اشراق اون لاين
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.