Яндекс Метрика

requests

open-llm-leaderboard-old

Технический архив заявок, отправленных на знаменитый Open LLM Leaderboard для оценки языковых моделей. Датасет позволяет отследить историю тестирования различных нейросетей, проанализировать их статус и понять причины ошибок при прохождении бенчмарков. Полезный ресурс для исследователей, следящих за эволюцией и прозрачностью оценки открытых LLM.