Яндекс Метрика

requests

open-llm-leaderboard-old

«Закулисье» знаменитого рейтинга Open LLM Leaderboard, где хранятся все файлы запросов на тестирование моделей. Датасет позволяет отследить историю сабмитов, проанализировать ошибки при проверке и понять, как развивались открытые языковые модели. Полезный ресурс для исследователей, желающих изучить динамику лидерборда и технические нюансы подачи заявок.