Модель показывает значительный прирост в задачах математики и программирования.
Anthropic представила обновлённую версию своей флагманской модели — Claude Opus 4.6. Новая версия показывает значительный прирост производительности в задачах сложного рассуждения.
На бенчмарке MATH модель набрала 96.2%, что на 8 процентных пунктов выше предыдущей версии. В задачах программирования на HumanEval+ результат составил 94.8%.
Ключевое улучшение — расширенная цепочка рассуждений, которая позволяет модели разбивать сложные задачи на более мелкие шаги.
Claude Opus 4.6 также получил улучшенную поддержку работы с инструментами и агентными сценариями.