يريد Moonvalley بناء نماذج فيديو أكثر أخلاقية
أدى التوافر الواسع للأدوات اللازمة لبناء الذكاء الاصطناعي التوليدي إلى انفجار كمبري للشركات الناشئة في الفضاء. ولم يكن رأس المال الوفيرة ضارا أيضا، وكذلك انخفاض تكلفة البنية التحتية التقنية اللازمة.
في الواقع، أحد أكثر تطبيقات الذكاء الاصطناعي التوليدي سطوعًا، وهو الفيديو التوليدي، قد يصبح مشبعًا بشكل مفرط. تقوم مختبرات مثل Genmo وHaiper وRhymes AI بإصدار نماذج بسرعة، وفي بعض الحالات، لا يميزها سوى القليل عن أحدث ما توصلت إليه التكنولوجيا السابقة.
يعتقد نعيم تالوكدار أن الثقة – وليس بالضرورة قدرات النموذج – هي ما سيميز بعض مشاريع الفيديو التوليدية عن الباقي. ولهذا السبب قام بتأسيس شركة Moonvalley، وهي شركة ناشئة مقرها في لوس أنجلوس تعمل على تطوير أدوات فيديو أكثر “شفافية” ظاهريًا.
قاد Talukdar نمو المنتجات في Zapier قبل تأسيس شركة Draft، المدعومة من Y Combinator، والتي استضافت سوقًا لمحتوى الذكاء الاصطناعي للمؤسسات. قام بتوظيف ماتيوس مالينوفسكي وميك بينكوفسكي لإطلاق Moonvalley، وكلاهما عالمان سابقان في DeepMind، حيث درسا تقنيات توليد الفيديو.
قال تالوكدار لـ TechCrunch: “لقد شاركنا الاعتقاد بأن توليد الفيديو سيُحدث تحولاً في وسائل الإعلام والترفيه، لكن الشركات الناشئة التي رأيناها تعمل في هذا المجال لم يكن لديها السمات اللازمة لتحقيق النجاح”. “كانت الشركات القائمة معادية بشدة تجاه الفنانين والمبدعين والصناعة الأوسع.”
من وجهة نظر تالوكدار، فإن معظم شركات الذكاء الاصطناعي المنتجة تدرب النماذج على البيانات العامة، وبعضها محمي بحقوق الطبع والنشر دائمًا. وتجادل هذه الشركات بأن مبدأ الاستخدام العادل يحمي هذه الممارسة. على سبيل المثال، أصرت شركة OpenAI على أنها لا تستطيع تدريب العارضات بشكل صحيح دون مواد محمية بحقوق الطبع والنشر، وجادل سونو بأن التدريب العشوائي لا يختلف عن “كتابة طفل لأغاني الروك الخاصة به بعد الاستماع إلى هذا النوع الموسيقي”.
لكن هذا لم يمنع أصحاب الحقوق من تقديم شكاوى أو التوقف عن العمل.
لقد أصبح البائعون وقحين للغاية حتى مع تراكم الدعاوى القضائية ضدهم. في وقت مبكر من هذا العام، لم تنكر ميرا موراتي، مديرة التكنولوجيا السابقة في OpenAI، بشكل صريح أن نموذج الفيديو الخاص بـ OpenAI، Sora، قد تم تدريبه على مقاطع YouTube – في انتهاك واضح لسياسة استخدام YouTube. في مكان آخر، يشير تقرير 404 Media إلى أن شركة Runway، وهي شركة ناشئة للفيديو، قامت بنسخ لقطات YouTube من قنوات تابعة لشركة Disney ومبدعين مثل MKBHD دون إذن.
تعترف شركة Viggle الكندية الناشئة في مجال الذكاء الاصطناعي بأنها تستخدم مقاطع فيديو YouTube لتغذية نماذج الفيديو الخاصة بها. ومثل معظم منافسيه، فهو لا يوفر أي ملاذ للمبدعين الذين ربما تكون أعمالهم قد اجتاحتها التدريبات.
قال تالوكدار: “تحتاج النماذج التوليدية إلى احترام حقوق النشر والعلامات التجارية وحقوق التشابه”. “لهذا السبب نتعاون بشكل وثيق مع المبدعين في نماذجنا.”
تدعي شركة Moonvalley، التي ليس لديها نموذج فيديو مدرب بالكامل حتى الآن، أنها واحدة من الشركات القليلة التي تستخدم البيانات المرخصة حصريًا من مالكي المحتوى الذين “اشتركوا”. لتغطية قواعدها، تعتزم Moonvalley السماح للمبدعين بطلب إزالة المحتوى الخاص بهم من نماذجها، والسماح للعملاء بحذف بياناتهم في أي وقت، وتقديم سياسة تعويض لحماية المستخدمين من تحديات حقوق الطبع والنشر.
ويتوازي هذا النهج مع Adobe، التي تقوم بتدريب نماذج فيديو Firefly الخاصة بها على محتوى مرخص من منصة Adobe Stock الخاصة بها. لم يذكر تالوكدار المبلغ الذي يدفعه Moonvalley للمساهمين مقابل المقاطع، لكنه قد يكون كثيرًا. ذكرت بلومبرج أن Adobe كانت تقدم حوالي 120 دولارًا لكل 40-45 دقيقة من الفيديو.
لكي نكون واضحين، فإن Moonvalley لا تقوم بشراء المحتوى بنفسها. إنها تعمل مع شركاء غير محددين يتعاملون مع ترتيبات الترخيص ويجمعون مقاطع الفيديو في مجموعات البيانات التي تشتريها Moonvalley.
هناك طلب كبير على هؤلاء الشركاء – الذين يطلق عليهم “وسطاء البيانات” – هذه الأيام، وذلك بفضل الطفرة التوليدية للذكاء الاصطناعي. ومن المتوقع أن ينمو سوق بيانات تدريب الذكاء الاصطناعي من حوالي 2.5 مليار دولار الآن إلى ما يقرب من 30 مليار دولار في غضون عقد من الزمن.
وأضاف تالوكدار: “نحن نقوم بترخيص بيانات عالية الجودة من مصادر متعددة تعمل مباشرة مع المبدعين وتعوضهم بشكل جيد مقابل استخدام محتواهم”. “نحن نضمن أننا نستخدم مجموعة بيانات متنوعة وعالية الجودة.”
على عكس بعض نماذج الفيديو “غير المفلترة” التي تدرج بسهولة شكل الشخص في المقاطع، تلتزم Moonvalley أيضًا ببناء حواجز حماية حول أدواتها الإبداعية. مثل OpenAI’s Sora، ستحظر نماذج Moonvalley محتوى معينًا، مثل عبارات NSFW، ولن تسمح للأشخاص بمطالبتهم بإنشاء مقاطع فيديو لأشخاص أو مشاهير محددين.
بالطبع، لا يوجد مرشح مثالي، لكن Talukdar يقول إن “الفريق الأحمر” هذا سيكون جزءًا أساسيًا من استراتيجية إطلاق Moonvalley.
وقال: “مع استمرار تطور العلاقة بين وسائل الإعلام والذكاء الاصطناعي بسرعة، وبدون شك، تهدف Moonvalley إلى ترسيخ نفسها باعتبارها الشريك الأكثر ثقة للمؤسسات الإعلامية”.
ولكن هل يستطيع Moonvalley المنافسة حقًا؟
كما أشرنا سابقًا، تسعى شركات جوجل وميتا وعدد لا يحصى من الشركات الأخرى إلى إنتاج مقاطع فيديو إبداعية، بدرجات متفاوتة من الاعتبارات الأخلاقية. ويعمل عمالقة التكنولوجيا على تغيير شروط الاستخدام الخاصة بهم للحصول على ميزة البيانات: إذ تقوم شركة جوجل بتدريب نموذج فيديو Veo الخاص بها على مقاطع فيديو على موقع YouTube، في حين تقوم شركة Meta بتدريب نماذجها على محتوى Instagram وFacebook.
تأمل Moonvalley في جذب العلامات التجارية والبيوت الإبداعية، لكن بعض البائعين قد حققوا بالفعل تقدمًا ملموسًا في هذا المجال. وقعت Runway مؤخرًا صفقة مع Lionsgate لتدريب نموذج مخصص على كتالوج أفلام الاستوديو؛ قامت شركة Stability AI بتعيين مخرج فيلم “Avatar” جيمس كاميرون في مجلس إدارتها؛ وتعاونت OpenAI مع العلامات التجارية والمديرين المستقلين لعرض إمكانات Sora.
ثم هناك Adobe، التي تسعى وراء السوق المستهدف لـ Moonvalley: الفنانون ومنشئو المحتوى الذين يريدون أدوات فيديو توليدية “أكثر أمانًا” (من منظور قانوني، على الأقل).
التحدي الذي يواجهه Moonvalley هو ثلاثة أضعاف. سيتعين عليها إقناع العملاء بأن أدواتها قادرة على المنافسة مع ما هو موجود بالفعل. سوف تحتاج إلى بناء مدرج كافٍ لتكون قادرة على تدريب وخدمة نماذج المتابعة. وسيتعين عليها تأمين قاعدة مخلصة من العملاء الذين لن يتحولوا إلى مزود آخر في أي لحظة.
يشعر العديد من الفنانين والمبدعين بالقلق من الذكاء الاصطناعي التوليدي، لأنه يهدد بقلب صناعة السينما والتلفزيون رأساً على عقب. تشير تقديرات دراسة أجريت عام 2024 بتكليف من نقابة الرسوم المتحركة، وهي اتحاد يمثل رسامي الرسوم المتحركة ورسامي الكاريكاتير في هوليوود، إلى أن أكثر من 100 ألف وظيفة في مجال الأفلام والتلفزيون والرسوم المتحركة في الولايات المتحدة سوف تتعطل بسبب الذكاء الاصطناعي بحلول عام 2026.
قال تالوكدار عندما سألته عن خطر فقدان المبدعين لوظائفهم بسبب الذكاء الاصطناعي الإنتاجي: “ينصب تركيزنا على بناء أدوات لمساعدة المبدعين على إنشاء محتوى أكبر وأكثر غامرة من أي وقت مضى”.
على جبهة المدرج، حققت Moonvalley’s بعض التقدم: فقد جمعت الشركة مؤخرًا 70 مليون دولار في جولة تمويل أولية بقيادة مشتركة من General Catalyst وKhosla Ventures، بمشاركة من Bessemer Ventures. سيؤدي ذلك إلى تمويل البحث والتطوير والتوظيف في Moonvalley.
ويقول تالوكدار إن الشركة لديها حاليًا حوالي 30 موظفًا عملوا سابقًا في DeepMind وMeta وMicrosoft وTikTok.
وأضاف: “ما يميزنا عن الشركات الأخرى هو التركيز على المنتج”. “في حين أن جوهر شركتنا هو تدريب أحدث النماذج التوليدية، فإن تركيزنا ينصب على بناء أدوات إبداعية ذات قدرة عميقة لتحويل هذه النماذج إلى معدات قوية للمبدعين المحترفين والاستوديوهات والعلامات التجارية.”
يقول Talukdar إن الخطة تهدف إلى إطلاق النموذج الأول لـ Moonvalley في وقت لاحق من هذا العام. سيتعين على الشركة أن تستعجل إذا كانت تأمل في التغلب على الإصدارات القادمة من Black Forest Labs وLuma Labs وMidjourney والفيل في الغرفة.
اكتشاف المزيد من اشراق اون لاين
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.