يخرج Deep Cogito من خلسة مع نماذج “التفكير” الهجينة

نشأت شركة جديدة ، Deep Cogito ، من الشبح مع عائلة من نماذج الذكاء الاصطناعى المتوفرة علناً والتي يمكن تبديلها بين أوضاع “التفكير” والأشكال غير المعروفة.
أظهرت نماذج التفكير مثل Openai’s O1 وعدًا كبيرًا في مجالات مثل الرياضيات والفيزياء ، وذلك بفضل قدرتها على التحقق من الحقائق بشكل فعال من خلال العمل من خلال مشاكل معقدة خطوة بخطوة. هذا المنطق يأتي بتكلفة ، ولكن: أعلى الحوسبة والكمون. لهذا السبب تتبع المختبرات مثل الأنثروبولوجيا البنية النموذجية “الهجينة” التي تجمع بين مكونات التفكير والعناصر القياسية غير المتقدمة. يمكن للنماذج الهجينة الإجابة بسرعة على الأسئلة البسيطة أثناء قضاء وقت إضافي في الاعتبار استفسارات أكثر تحديا.
جميع نماذج Deep Cogito ، والتي تسمى Cogito 1 ، هي نماذج هجينة. يدعي Cogito أنها تتفوق على أفضل النماذج المفتوحة من نفس الحجم ، بما في ذلك النماذج من Meta و Deepseek Startup AI الصينية.
“يمكن لكل نموذج الإجابة مباشرة […] أو عاكسة الذات قبل الرد (مثل نماذج التفكير) “، أوضحت الشركة في منشور المدونة.”[All] تم تطويره من قبل فريق صغير في حوالي 75 يومًا. “
تتراوح طرز Cogito 1 من 3 مليارات معلمة إلى 70 مليار معلمة ، وتقول Cogito إن النماذج التي تتراوح ما يصل إلى 671 مليار معلمة ستنضم إليهم في الأسابيع والأشهر المقبلة. تتوافق المعلمات تقريبًا مع مهارات حل المشكلات في النموذج ، مع وجود المزيد من المعلمات بشكل عام.
لم يتم تطوير Cogito 1 من الصفر ، ليكون واضحًا. تم تصميم Deep Cogito على نماذج Llama المفتوحة من Meta و Qwen في Meta لإنشاء خاص بها. تقول الشركة إنها تطبق مناهج تدريب جديدة لزيادة أداء النماذج الأساسية وتمكين التفكير القابل للمقابل.
وفقًا لنتائج القياس الداخلي لـ Cogito ، فإن أكبر نموذج Cogito 1 ، Cogito 70b ، مع التفكير يتفوق على نموذج التفكير في Deepseek على عدد قليل من الرياضيات وتقييمات اللغة. Cogito 70B مع تعطيل التفكير المنطقي أيضًا من طراز Llama 4 Scout الذي تم إصداره مؤخرًا على LiveBench ، وهو اختبار منظمة العفو الدولية للأغراض العامة.
يتوفر كل طراز Cogito 1 للتنزيل أو الاستخدام عبر واجهات برمجة التطبيقات على مقدمي الخدمات السحابية AI و AI معًا.
“حاليًا ، ما زلنا في المراحل المبكرة من [our] كتب Cogito في منشور مدونته: “المضي قدمًا ، نتحقق من أساليب ما بعد التدريب التكميلية لتحسين الذات”.
وفقًا للاطلاع على ملفات مع ولاية كاليفورنيا ، تأسست Deep Cogito ومقرها سان فرانسيسكو في يونيو 2024. وتسرد صفحة LinkedIn للشركة اثنين من المؤسسين ، Drishan Arora و Dhruv Malhotra. كان Malhotra سابقًا مديرًا للمنتجات في Google AI Lab DeepMind ، حيث عمل على تكنولوجيا البحث التوليدي. كان Arora مهندس برمجيات كبير في Google.
تهدف Deep Cogito ، الذي يشمل مؤيدوه ساوث بارك كومونز ، وفقًا لـ Pitchbook ، طموحًا إلى بناء “General Superintelligence”. يفهم مؤسسو الشركة العبارة التي تعني الذكاء الاصطناعي التي يمكنها أداء المهام بشكل أفضل من معظم البشر و “اكتشاف قدرات جديدة تمامًا لم نتخيلها بعد”.
اكتشاف المزيد من اشراق اون لاين
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.