Яндекс Метрика
Ответы на вопросы

mmlu

cais

Золотой стандарт для оценки «интеллекта» больших языковых моделей. Датасет включает тысячи вопросов с вариантами ответов по 57 различным темам — от высшей математики и медицины до гуманитарных наук. Идеальный инструмент, чтобы проверить, насколько хорошо ваша модель понимает мир и справляется с многозадачностью.