// описание

Технический архив заявок, отправленных на знаменитый Open LLM Leaderboard для оценки языковых моделей. Датасет позволяет отследить историю тестирования различных нейросетей, проанализировать их статус и понять причины ошибок при прохождении бенчмарков. Полезный ресурс для исследователей, следящих за эволюцией и прозрачностью оценки открытых LLM.

← все датасеты

requests