NVIDIA представила GB300 — специализированный чип для инференса крупных языковых моделей. 3-кратный прирост производительности по сравнению с H100.

GB300 разработан с учётом требований современных LLM: увеличенная пропускная способность памяти и оптимизированный KV-кэш.

Первые партии чипов уже поставляются гиперскейлерам.