Anthropic تطلق Claude Sonnet 5: أداء يقترب من Opus بسعر الفئة المتوسّطة
أطلقت Anthropic نموذج Claude Sonnet 5، أكثر نماذج Sonnet قدرةً على العمل الوكيليّ، بأداء يقترب من Opus 4.8 وسعر أقلّ، متاحًا على كل الخطط. نظرة على قدراته وتسعيره وتحفّظاته.
في خضمّ سباق محتدم على النماذج «الوكيلة»، أطلقت Anthropic نموذجها الجديد Claude Sonnet 5، واصفةً إيّاه بأنه «أكثر نماذج Sonnet قدرةً على العمل الوكيليّ حتى الآن». الفكرة المحورية بسيطة ومغرية: أداء يقترب من نماذج Opus باهظة الثمن، لكن بسعر الفئة المتوسّطة. أُعلن النموذج في 30 يونيو 2026، وصار متاحًا فورًا عبر كل الخطط — حتى المجانية — وفي Claude Code ومنصّة Claude وواجهتها البرمجية.
وعد جوهريّ: قدرة قريبة من Opus بسعر أقلّ
تقول Anthropic إن Sonnet 5 يضيّق الفجوة مع نماذج Opus مع خفض السعر. فهو يحمل تحسّنًا كبيرًا على سلفه Sonnet 4.6 في الاستدلال واستخدام الأدوات والبرمجة والعمل المعرفيّ، ويقترب أداؤه من Opus 4.8 في مجالات معيّنة. على أحد اختبارات البرمجة الوكيلية، سجّل Sonnet 5 نحو 63.2% مقابل 69.2% لـ Opus 4.8 و58.1% لـ Sonnet 4.6؛ بل تفوّق قليلًا على Opus 4.8 في اختبار للعمل المعرفيّ. لكنّ Anthropic نفسها تقرّ بأن Opus 4.8 يبقى الخيار الأدقّ للمهامّ عالية العواقب.
«ينهي المهامّ» بدل التوقّف في منتصفها
ما لفت الشركاء في الوصول المبكّر ليس الأرقام، بل السلوك. فبحسب شهاداتهم، يُكمل Sonnet 5 المهامّ المركّبة التي كانت النماذج السابقة «تتوقّف قبل نهايتها»، ويراجع مخرجاته دون أن يُطلب منه ذلك. وصف مهندس في Zapier مهمّة من شقّين — تحديث فئات حسابات Salesforce وإرسال إعلان — بأنها «كانت تتعثّر في منتصفها» سابقًا، لكنها اكتملت الآن من البداية للنهاية. وهذه تحديدًا فجوة الموثوقية التي أبقت كثيرًا من المؤسّسات مترددةً في نقل الوكلاء من التجارب إلى الإنتاج: نموذج يقطع 80% من مهمّة ثم يتوقّف يخلق مشكلات أكثر ممّا يحلّ.
التسعير: قلب الإعلان
قد يكون السعر أهمّ ما في الإعلان. يبدأ Sonnet 5 بتسعير تعريفيّ قدره دولاران لكل مليون رمز إدخال، وعشرة للإخراج، حتى 31 أغسطس 2026، ثم يرتفع إلى 3 و15 على التوالي. يبقى هذا أرخص من Opus 4.8 (5 و25)، ومن GPT-5.5 وGemini 3.1 Pro. لكنّ هنا تفصيلًا مدفونًا يستحقّ الانتباه: يستخدم Sonnet 5 «مُرمِّزًا» (Tokenizer) جديدًا يجعل النصّ نفسه يتحوّل إلى عدد أكبر من الرموز (بزيادة تقارب 30% وسطيًّا). تقول Anthropic إن السعر التعريفيّ مُعايَر ليجعل الانتقال «محايد التكلفة تقريبًا»، لكنّ المؤسّسات ذات الأحمال الضخمة ستحتاج لقياس حالتها بدقّة قبل افتراض ثبات فواتيرها — خصوصًا بعد سبتمبر.
وجهة نظر مقابلة: تحفّظات مستقلّة
الصورة ليست دعائية بالكامل. فبعيدًا عن أرقام Anthropic الرسمية، أفاد المطوّر ثيو براون أن Sonnet 5 سجّل في اختباره نحو 37% على مهمّة برمجية، مع استهلاكه نحو ستة آلاف دولار في كلفة الاختبار — وهو من أعلى ما رُصِد لنموذج. وحذّر محلّلون آخرون من أن قراءة «نموذج أحدث = أفضل» قراءة ضيّقة: Sonnet 5 يرفع الأساس فعلًا، لكنه يظلّ بحاجة لتحقّق على مستوى المهمّة مقابل قواعد شيفرة وأدوات حقيقية قبل الاعتماد عليه في الإنتاج. هذا التوازن مهمّ: القيمة الحقيقية تظهر في أحمال بعينها، لا في كل استخدام.
الأمان والسياق الأوسع
على صعيد الأمان، تقول Anthropic إن Sonnet 5 يُظهر معدّلًا أقلّ من «السلوكيات غير المرغوبة» مقارنةً بـ Sonnet 4.6، وأقلّ هلوسةً وتملّقًا، وأكثر مقاومةً لهجمات «حقن التعليمات». وأُطلق بحمايات سيبرانية مفعّلة افتراضيًّا، لكنها أقلّ صرامةً من حمايات Fable 5، لأن الشركة قدّرت أن خطره السيبرانيّ منخفض. ويأتي الإطلاق ضمن تحوّل أوسع في الصناعة من التنافس على الأرقام إلى التنافس على «ما تستطيع المؤسّسات تحمّل نشره فعلًا»، وهو ما يخدم سردية Anthropic وهي تتّجه لطرح عامّ أوليّ مرتقب. ويعكس مسارًا مشابهًا لدى المنافسين: GPT-5.6 من OpenAI وGemini 3.5 Flash من Google، وكلاهما رُوِّج له كنقلة نحو الوكالة.
بالنسبة للمطوّر العربي، يمثّل Sonnet 5 خيارًا عمليًّا لتشغيل الوكلاء بتكلفة أدنى، خصوصًا في المهامّ متعدّدة الخطوات التي تتطلّب سياقًا طويلًا وأدوات متعدّدة وتقليلًا لحلقات التصحيح البشريّ. لكنّ النصيحة المتّزنة تبقى: قِس على حِملك أنت قبل الهجرة، وانتبه لأثر المُرمِّز الجديد على تكلفتك الفعلية بعد انتهاء العرض التعريفيّ.