تقنية

يوافق Elon Musk على أننا استنفدنا بيانات تدريب الذكاء الاصطناعي


يتفق إيلون ماسك مع خبراء آخرين في الذكاء الاصطناعي على أنه لم يتبق سوى القليل من البيانات الواقعية لتدريب نماذج الذكاء الاصطناعي عليها.

“لقد استنفدنا الآن بشكل أساسي المجموع التراكمي للمعرفة الإنسانية…. قال ماسك خلال محادثة تم بثها مباشرة مع رئيس شركة Stagwell، مارك بن، على قناة X في وقت متأخر من يوم الأربعاء: “في تدريب الذكاء الاصطناعي”. “لقد حدث هذا بشكل أساسي في العام الماضي.”

ردد ماسك، الذي يمتلك شركة الذكاء الاصطناعي xAI، المواضيع التي تطرق إليها إيليا سوتسكيفر، كبير العلماء السابق في OpenAI، في مؤتمر NeurIPS للتعلم الآلي، خلال خطاب ألقاه في ديسمبر. وتوقع سوتسكيفر، الذي قال إن صناعة الذكاء الاصطناعي وصلت إلى ما أسماه “ذروة البيانات”، أن نقص بيانات التدريب سيؤدي إلى التحول عن الطريقة التي يتم بها تطوير النماذج اليوم.

في الواقع، اقترح ماسك أن البيانات الاصطناعية – البيانات التي تم إنشاؤها بواسطة نماذج الذكاء الاصطناعي نفسها – هي الطريق إلى الأمام. “الطريقة الوحيدة للتكملة [real-world data] مع البيانات الاصطناعية، حيث ينشئ الذكاء الاصطناعي [training data]قال. “مع البيانات الاصطناعية … [AI] سوف يقوم بتصنيف نفسه ويخضع لعملية التعلم الذاتي هذه.”

وتستخدم شركات أخرى، بما في ذلك عمالقة التكنولوجيا مثل ميكروسوفت، وميتا، وأوبن إيه آي، وأنتروبيك، بالفعل البيانات الاصطناعية لتدريب نماذج الذكاء الاصطناعي الرائدة. وتشير تقديرات جارتنر إلى أن 60% من البيانات المستخدمة في مشاريع الذكاء الاصطناعي والتحليلات في عام 2024 تم إنشاؤها صناعيًا.

تم تدريب Phi-4 من Microsoft، والذي كان مفتوح المصدر في وقت مبكر من يوم الأربعاء، على البيانات الاصطناعية إلى جانب بيانات العالم الحقيقي. وكذلك كانت نماذج جيما من جوجل. استخدمت أنثروبيك بعض البيانات الاصطناعية لتطوير أحد أنظمتها الأكثر أداءً، وهو Claude 3.5 Sonnet. وقامت Meta بضبط أحدث سلسلة من نماذج Llama باستخدام البيانات التي تم إنشاؤها بواسطة الذكاء الاصطناعي.

والتدريب على البيانات الاصطناعية له مزايا أخرى، مثل توفير التكاليف. تزعم شركة AI الناشئة Writer أن نموذج Palmyra X 004، الذي تم تطويره باستخدام مصادر اصطناعية بالكامل تقريبًا، كلف تطويره 700 ألف دولار فقط – مقارنة بتقديرات تبلغ 4.6 مليون دولار لنموذج OpenAI ذو الحجم المماثل.

ولكن هناك عيوب كذلك. تشير بعض الأبحاث إلى أن البيانات الاصطناعية يمكن أن تؤدي إلى انهيار النموذج، حيث يصبح النموذج أقل “إبداعا” – وأكثر انحيازا – في مخرجاته، مما يؤدي في النهاية إلى الإضرار بوظائفه بشكل خطير. ونظرًا لأن النماذج تنشئ بيانات تركيبية، فإذا كانت البيانات المستخدمة لتدريب هذه النماذج تحتوي على تحيزات وقيود، فإن مخرجاتها ستكون مشوهة بالمثل.



المصدر


اكتشاف المزيد من اشراق اون لاين

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من اشراق اون لاين

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading