من المؤكد أن يبدو أن Openai مدربة Sora على محتوى اللعبة – ويقول الخبراء القانونيون إن ذلك قد يكون مشكلة

eshrag ديسمبر 11, 2024

0 45 6 دقائق

من المؤكد أن يبدو أن Openai مدربة Sora على محتوى اللعبة – ويقول الخبراء القانونيون إن ذلك قد يكون مشكلة

لم تكشف Openai أبدًا عن البيانات التي استخدمتها لتدريب Sora ، AI المولدة بالفيديو. ولكن من مظهره ، قد تأتي بعض البيانات على الأقل من تيارات Twitch وتجول من الألعاب.

أطلقت سورا يوم الاثنين ، وكنت ألعب معها قليلاً (إلى الحد الذي ستسمح فيه مشكلات السعة). من موجه نص أو صورة ، يمكن لـ Sora إنشاء مقاطع فيديو لمدة 20 ثانية في مجموعة من نسب الأطوالي والقرارات.

عندما كشفت Openai لأول مرة إلى Sora في فبراير ، ألمحت إلى حقيقة أنه قام بتدريب النموذج على مقاطع فيديو Minecraft. لذلك ، تساءلت ، ما هي ألعاب الفيديو الأخرى التي قد تكون متجانسة في مجموعة التدريب؟

عدد قليل ، على ما يبدو.

يمكن لـ Sora إنشاء مقطع فيديو لما هو في الأساس استنساخ Super Mario Bros. (إذا كان أحدهم لامع):

ائتمانات الصورة:Openai

يمكن أن ينشئ لقطات لعب لطلق النار من أول شخص يبدو مستوحى من Call of Duty و Counter-Strike:

لعبة فيديو Openai Sora — **ائتمانات الصورة:**Openai

ويمكن أن يبصق مقطعًا يوضح مقاتلًا أركيد بأسلوب لعبة سلحفاة النينجا في سن المراهقة في التسعينيات:

يبدو أن سورا لديها أيضًا فهم ما يجب أن يبدو عليه تيار نشل – مما يعني أنه شوهد قليلًا. تحقق من لقطة الشاشة أدناه ، والتي تحصل على السكتات الدماغية العريضة بشكل صحيح:

شيء آخر جدير بالملاحظة حول لقطة الشاشة: إنه يتميز بمثل جينات Twitch الشهير Raúl álvarez ، الذي يحمل اسم AuronPlay – وصولاً إلى الوشم على الساعد اليسرى الجينات.

AuronPlay ليس هو Twitch Spreyer الوحيد الذي يبدو أن Sora “يعرف”. ولدت مقطع فيديو لشخصية مماثلة في المظهر (مع بعض الحريات الفنية) إلى Imane Anys ، والمعروفة باسم Pokimane.

منحت ، اضطررت إلى الإبداع مع بعض المطالبات (على سبيل المثال “لعبة السباك الإيطالية”). قام Openai بتنفيذ التصفية لمحاولة منع Sora من توليد مقاطع تصور الشخصيات التجارية. على سبيل المثال ، فإن كتابة شيء مثل “Mortal Kombat 1 Gameplay” ، على سبيل المثال ، لن يؤدي إلى أي شيء يشبه العنوان.

لكن اختباراتي تشير إلى أن محتوى اللعبة قد يكون قد وجد طريقه إلى بيانات تدريب سورا.

كان Openai cagey حول المكان الذي تحصل عليه من بيانات التدريب. في مقابلة مع The Wall Street Journal في مارس ، لن تنكر Mira Murati من Openai آنذاك ، Mira Murati ، أن Sora تم تدريبها على محتوى YouTube و Instagram و Facebook. وفي المواصفات التقنية لـ Sora ، اعترف Openai بأنها استخدمت بيانات “متاحة للجمهور” ، إلى جانب البيانات المرخصة من مكتبات وسائط الأسهم مثل Shutterstock ، لتطوير Sora.

لم يرد Openai أيضًا على طلب للتعليق.

إذا كان محتوى اللعبة موجودًا بالفعل في مجموعة تدريب Sora ، فقد يكون له آثار قانونية – خاصةً إذا قام Openai ببناء المزيد من التجارب التفاعلية على رأس Sora.

وقال جوشوا ويغنسبرج ، محامي بروتوكول الإنترنت في بريور كاشمان ، لـ TechCrunch: “الشركات التي تتدرب على لقطات غير مرخصة من ألعاب الفيديو ، تدير العديد من المخاطر”. “تدريب نموذج الذكاء الاصطناعى التوليدي ينطوي بشكل عام على نسخ بيانات التدريب. إذا كانت هذه البيانات عبارة عن عمليات ألعاب فيديو للألعاب ، فمن المحتمل أن يتم تضمين المواد المحمية بحقوق الطبع والنشر في مجموعة التدريب. “

النماذج الاحتمالية

نماذج الذكاء الاصطناعى التوليدي مثل Sora هي احتمالية. تدرب على الكثير من البيانات ، يتعلمون أنماطًا في تلك البيانات لجعل التنبؤات – على سبيل المثال ، أن الشخص الذي يعض في برغر سيترك علامة لدغة.

هذه خاصية مفيدة. إنه يمكّن النماذج من “تعلم” كيفية عمل العالم ، إلى حد ما ، من خلال مراقبة ذلك. ولكن يمكن أن يكون أيضا كعب أخيل. عندما تتم المطالبة بطريقة محددة ، يتم تدريب نماذج-يتم تدريب العديد منها على بيانات الويب العامة-عن أمثلة التدريب الخاصة بهم.

وقد تم إحباط المبدعين الذين تم استيعابهم بشكل مفهوم في التدريب دون إذنهم. يبحث العدد المتزايد عن سبل الانتصاف من خلال نظام المحاكم.

يتم حاليًا مقاضاة Microsoft و Openai بسبب السماح بأدوات الذكاء الاصطناعى الخاصة بهم بتجديد التعليمات البرمجية المرخصة. هناك ثلاث شركات وراء تطبيقات AI Art الشهيرة ، Midjourney ، Runway ، و AI ، في تقاطع القضية التي تتهمهم بالانتهاك لحقوق الفنانين. ورفعت ملصقات الموسيقى الرئيسية بدلة ضد شركات ناشئة تقومان بتطوير مولدات الأغاني التي تعمل بمنظمة العفو الدولية ، Udio و Suno ، من الانتهاك.

طالبت العديد من شركات الذكاء الاصطناعى حماية الاستخدام العادل ، مؤكدين أن نماذجها تخلق أعمال تحويلية وليست انتحارية. يوضح Suno ، على سبيل المثال ، أن التدريب العشوائي لا يختلف عن “طفل يكتب أغاني موسيقى الروك الخاصة به بعد الاستماع إلى هذا النوع”.

يقول إيفان إيفرست ، المحامي في دورسي آند ويتني في قانون حقوق الطبع والنشر ، ولكن هناك بعض الاعتبارات الفريدة مع محتوى اللعبة.

وقال إيفرست لـ TechCrunch في رسالة بالبريد الإلكتروني: “تتضمن مقاطع الفيديو الخاصة بـ Playthroughs طبقتان على الأقل من حماية حقوق الطبع والنشر: محتويات اللعبة المملوكة لمطور اللعبة ، والفيديو الفريد الذي أنشأه اللاعب أو المصور الإلكتروني الذي يلتقط تجربة اللاعب”. “وبالنسبة لبعض الألعاب ، هناك طبقة ثالثة محتملة من الحقوق في شكل محتوى تم إنشاؤه بواسطة المستخدم يظهر في البرنامج.”

أعطى Everist مثال Fortnite’s Epic ، والذي يتيح للاعبين إنشاء خرائط ألعابهم الخاصة ومشاركتها لاستخدامها في الآخرين. وقال إن مقطع فيديو لمباراة واحدة من هذه الخرائط يثير ما لا يقل عن ثلاثة أصحاب حقوق الطبع والنشر: (1) ملحمة ، (2) الشخص الذي يستخدم الخريطة ، و (3) منشئ الخريطة.

وقال إيفرست: “إذا وجدت المحاكم مسؤولية حقوق الطبع والنشر عن تدريب نماذج الذكاء الاصطناعي ، فإن كل من حاملي حقوق الطبع والنشر هؤلاء سيكونون المدعين المحتملين أو مصادر الترخيص”. “بالنسبة لأي مطورين تدريب الذكاء الاصطناعي على مقاطع الفيديو هذه ، فإن التعرض للمخاطر هو الأسي.”

أشار Weigensberg إلى أن الألعاب نفسها لديها العديد من العناصر “التي يمكن الحماية” ، مثل القوام الملكية ، التي قد يفكر فيها القاضي في بدلة IP. وقال “ما لم تكن هذه الأعمال مرخصة بشكل صحيح ،” قد ينتهك التدريب عليها “.

وصل TechCrunch إلى عدد من استوديوهات الألعاب والناشرين للتعليق ، بما في ذلك Epic و Microsoft (التي تمتلك Minecraft) و Ubisoft و Nintendo و Roblox و Cyberpunk CD Projekt Red. ورد قليلون-ولم يقدم أي منهم بيانًا عند الرقم القياسي.

وقال متحدث باسم CD Projekt Red: “لن نتمكن من المشاركة في مقابلة في الوقت الحالي”. أخبرت EA TechCrunch ذلك “لم يكن لديه أي تعليق في هذا الوقت”.

المخرجات المحفوفة بالمخاطر

من الممكن أن تسود شركات الذكاء الاصطناعي في هذه النزاعات القانونية. قد تقرر المحاكم أن الذكاء الاصطناعى التوليدي لديه “غرض تحويلي مقنع للغاية” ، في أعقاب مجموعة السابقة قبل عقد من الزمان تقريبًا في بدلة صناعة النشر ضد Google.

في هذه الحالة ، رأت محكمة أن نسخ Google لملايين الكتب لكتب Google ، وهو نوع من الأرشيف الرقمي ، كان مسموحًا به. حاول المؤلفون والناشرين القول بأن إعادة إنتاج IP الخاصة بهم عبر الإنترنت بمثابة انتهاك.

لكن الحكم المؤيد لشركات الذكاء الاصطناعى لن يحمي بالضرورة المستخدمين من اتهامات ارتكاب مخالفات. إذا قام النموذج التوليدي بتجديد عمل محمي بحقوق الطبع والنشر ، فإن الشخص الذي ذهب بعد ذلك ونشر هذا العمل – أو دمجه في مشروع آخر – يمكن أن يكون مسؤولاً عن انتهاك IP.

وقال ويغنزبرغ: “غالبًا ما تبصق أنظمة الذكاء الاصطناعى الأوليات التي يمكن التعرف عليها وقابلة للحماية على أنها ناتج”. “إن الأنظمة الأكثر بساطة التي تولد نصًا أو صورًا ثابتة تواجه مشكلة في منع توليد المواد المحمية بحقوق الطبع والنشر في إنتاجها ، وبالتالي قد تكون أنظمة أكثر تعقيدًا لديها نفس المشكلة بغض النظر عن نوايا المبرمجين”.

بعض شركات الذكاء الاصطناعى لديها شروط تعويض لتغطية هذه المواقف ، في حالة ظهورها. لكن الجمل غالباً ما تحتوي على نقاط. على سبيل المثال ، ينطبق Openai على عملاء الشركات فقط – وليس المستخدمين الأفراد.

يقول ويغنسبرج ، مثل مخاطر إلى جانب حقوق الطبع والنشر للنظر فيها ، مثل انتهاك حقوق العلامات التجارية.

وقال: “يمكن أن يشمل الإخراج أيضًا الأصول المستخدمة فيما يتعلق بالتسويق والعلامات التجارية – بما في ذلك الشخصيات المعروفة من الألعاب – مما يخلق مخاطر العلامة التجارية”. “أو يمكن أن يخلق الإخراج مخاطر للاسم والصورة والحقوق.”

الاهتمام المتزايد بنماذج العالم يمكن أن يزيد كل هذا. أحد تطبيقات النماذج العالمية – التي يعتبرها Openai تعتبر Sora – توليد ألعاب الفيديو بشكل أساسي في الوقت الفعلي. إذا كانت هذه الألعاب “الاصطناعية” تشبه المحتوى الذي تم تدريبه على النموذج ، فقد يكون ذلك مشكلة من الناحية القانونية.

“إن تدريب منصة الذكاء الاصطناعى على الأصوات ، والحركات ، والشخصيات ، والأغاني ، والحوار ، والأعمال الفنية في لعبة فيديو يشكل انتهاكًا لحقوق الطبع والنشر ، تمامًا كما لو كانت هذه العناصر في سياقات أخرى” قال سميث. “إن الأسئلة المتعلقة بالاستخدام العادل والتي نشأت في العديد من الدعاوى القضائية ضد شركات الذكاء الاصطناعى التوليدي ستؤثر على صناعة ألعاب الفيديو بقدر أي سوق إبداعي آخر.”

المصدر