تقدم شركة Anthropic أقوى نموذج للذكاء الاصطناعي لديها لعامة الناس للمرة الأولى، لكنها تفعل ذلك باستخدام حواجز الحماية.
وفي يوم الثلاثاء، أطلقت شركة الذكاء الاصطناعي Claude Fable 5، وهي أول نسخة متاحة للجمهور من نموذج Mythos الخاص بها. تقول Anthropic أن Fable 5 تتفوق في هندسة البرمجيات والعمل المعرفي والرؤية، ولكنها تأتي مع حدود أمان صارمة. في المجالات عالية المخاطر مثل الأمن السيبراني، وعلم الأحياء، والكيمياء، و، يحجب النموذج الاستجابات ويعود إلى كلود أوبوس 4.8.
تم إطلاق Mythos كمعاينة في أبريل، وكان يقتصر في البداية على عدد قليل من الشركاء بسبب مخاوف تتعلق بالأمن السيبراني. في الأسبوع الماضي، انتشر مؤتمر الأنثروبي في 15 دولة، وركز مرة أخرى على المنظمات التي تدير البنية التحتية الحيوية.
والآن أصبح إصدار من هذه التكنولوجيا متاحًا لأي شخص من خلال Anthropic’s Claude API وخطط المؤسسات القائمة على الاستهلاك. سيتم طرح الوصول إلى الاشتراكات على مراحل: حتى 22 يونيو، سيتم تضمين Fable 5 في خطط Pro وMax وTeam وEnterprise القائمة على المقاعد دون أي تكلفة إضافية. في 23 يونيو، ستقوم Anthropic بسحب Fable 5 من تلك الخطط، مما يتطلب أرصدة استخدام للمضي قدمًا، مع خطط لاستعادتها كميزة اشتراك قياسية في أقرب وقت ممكن.
تقوم Anthropic أيضًا بنشر إصدار جديد من Mythos، يسمى Mythos 5، للمؤسسات التي تمت الموافقة عليها بالفعل للوصول إلى النموذج المتقدم.
يأتي إطلاق Fable في الوقت الذي تستعد فيه Anthropic لدخول الأسواق العامة، جنبًا إلى جنب مع Elon Musk. كما أنه يتبع حث مختبرات الذكاء الاصطناعي العالمية الكبرى على إنشاء دواسة فرامل منسقة لتطوير الذكاء الاصطناعي الحدودي. حذرت أنثروبيك من أن الأنظمة تتقدم بسرعة كبيرة لدرجة أنها قد تحقق قريبًا تحسينًا ذاتيًا متكررًا (RSI)، حيث تعمل على تحسين نفسها بشكل مستقل دون تدخل بشري.
نظرًا لقلقها مما يمكن أن يفعله نموذج من فئة Mythos إذا وقع في الأيدي الخطأ، تقول Anthropic إنها اختبرت مصنفاتها بمحاولات كسر الحماية قبل إصدار Fable 5.
“على المستوى الداخلي، قمنا بتنفيذ مكافأة خارجية للأخطاء، والتي لم تنتج أي عمليات كسر حماية عالمية خلال أكثر من 1000 ساعة من الاختبار. ثم عملنا بعد ذلك مع مؤسسات خارجية ذات فريق أحمر والتي فشلت أيضًا في العثور على عمليات كسر حماية عالمية.”
ومع ذلك، من الممكن أن تكون هناك هجمات جديدة. ونتيجة لذلك، مع إطلاق Fable 5 وMythos 5، قالت Anthropic إنها ستتطلب الاحتفاظ لمدة 30 يومًا على كل حركة المرور، حتى لو كانت الشركات قد أبرمت سابقًا اتفاقيات عدم الاحتفاظ بالبيانات. وقالت الشركة إنها لن تستخدم البيانات للتدريب وستستخدمها فقط “للدفاع ضد الهجمات المعقدة والجديدة، بما في ذلك عمليات كسر الحماية الجديدة”، و”تحديد النتائج الإيجابية الكاذبة والحد منها”. ومن الممكن أن تشكل هذه السياسة سابقة في الصناعة، حيث يأتي الوصول إلى النماذج القوية بشكل متزايد مع سياسات إلزامية للاحتفاظ بالبيانات في إطار تدابير السلامة.
بالنسبة لأولئك الذين يستمرون في استخدام النموذج، لن يحصل كل سؤال على إجابة Fable 5. تقول Anthropic أن الحالات التي يتعين فيها على Fable أن تلجأ إلى Opus 4.8 نادرة، حيث تظهر البيانات المبكرة أن 95% على الأقل من جلسات Fable تعمل بالكامل على استجابات النموذج نفسه.
في اختبار الطرف الثالث، قالت شركة التحليلات Hex في بيان إن Fable كانت أول من حصل على 90% في معيار التحليلات الأساسي الخاص بها للمهام التحليلية المعقدة وطويلة الأمد.
قال هيكس: “فيما يتعلق بأصعب الأسئلة، فإنه يُظهر حكمًا قويًا واهتمامًا بالفروق الدقيقة”.
أشارت منصة ترميز Vibe Base44 في بيان لها إلى أن Fable أفضل في “التطبيقات الكاملة ذات اللقطة الواحدة” ولديها قدرة ممتازة على استدعاء الأدوات. قالت شركة Genspark لمساحة العمل التي تعمل بالذكاء الاصطناعي ومنصة الوكيل إن Fable تفوقت على كل النماذج الأخرى في تقييماتها وكان أداؤها أفضل بكثير في مهام مثل تصميم واجهة المستخدم وترميز الألعاب.
سعر كل من Fable 5 وMythos 5 هو 10 دولارات لكل مليون رمز إدخال و50 دولارًا لكل مليون رمز مخرج، وهو ضعف سعر Opus 4.8. وهذا السعر وحده قد يكون بمثابة رادع للاستخدام على نطاق واسع.
تتزايد انتقادات العديد من الشركات لتكاليف الذكاء الاصطناعي بعد أو تنفق ميزانياتها السنوية للذكاء الاصطناعي مبكرًا. يمكن للنماذج المتقدمة مثل Opus 4.8 أن تؤدي إلى تفاقم هذه المشكلات، من خلال مهارات التفكير المتقدمة التي يمكنها تقسيم طلب واحد إلى مهام متعددة.
قالت Anthropic إنها تتوقع أن يكون الطلب على Fable 5 مرتفعًا جدًا ويصعب التنبؤ به. وفي الواقع، قد يعتقد البعض، مثل منصة مكافآت التسوق Rakuten، أن الاتجاه الصعودي يستحق نقطة السعر.
وقال راكوتين في بيان: “بأقصى جهد، تعكس Fable عملها وتتحقق من صحته”. “بالنسبة لنا، هذا ما يجعل العمليات المستقلة للغاية ممكنة، فالتفكير الإضافي يدفع تكاليفه”.
عندما تقوم بالشراء من خلال الروابط الموجودة في مقالاتنا، . هذا لا يؤثر على استقلالنا التحريري.
