Anthropic представила обновлённую версию своей флагманской модели — Claude Opus 4.6. Новая версия показывает значительный прирост производительности в задачах сложного рассуждения.

На бенчмарке MATH модель набрала 96.2%, что на 8 процентных пунктов выше предыдущей версии. В задачах программирования на HumanEval+ результат составил 94.8%.

Ключевое улучшение — расширенная цепочка рассуждений, которая позволяет модели разбивать сложные задачи на более мелкие шаги.

Claude Opus 4.6 также получил улучшенную поддержку работы с инструментами и агентными сценариями.