Сравнение NVIDIA H100 и RTX 5090 для обучения LLM: что выбрать в 2026 году

Актуально на 20 января 2026

В начале 2026 года RTX 5090 (потребительская версия архитектуры Blackwell) становится серьезным игроком, в то время как H100/H200 уже два года являются золотым стандартом для Enterprise AI. Мы проанализировали тесты Llama-3 70B, Qwen-72B и других моделей, чтобы понять: стоит ли переплачивать за серверные GPU в условиях текущего рынка России.

Кратко: RTX 5090 лидирует по показателю цена/производительность для Fine-tuning задач (в 8–15 раз выгоднее), но H100 остается единственным выбором для масштабного pre-training и тяжелого инференса с NVLink.

Ключевые характеристики (январь 2026)

Параметр	NVIDIA H100 SXM	NVIDIA RTX 5090	Лидер для LLM
Память	80 ГБ HBM3 (3.35 ТБ/с)	32–48 ГБ GDDR7 (1.8 ТБ/с)	H100
FP8 Performance	~3.9 PFLOPS	~4.8 PFLOPS	RTX 5090
NVLink Speed	900 ГБ/с (Full)	Limited / No NVLink	H100
Цена (РФ, 2026)	18–28 млн ₽	350–600 тыс. ₽	RTX 5090

Реальное сравнение в задачах обучения

Сценарий	H100 Cluster (8x)	RTX 5090 Node (8x)	Победитель
Fine-tuning 70B (LoRA)	Максимальная скорость	Очень близко (на 15% медленнее)	RTX 5090 (Цена)
Pre-training с нуля	Стандарт индустрии	Нереально (узкое место памяти)	H100
Inference (vLLM)	Высокая плотность	Самый низкий $/token	RTX 5090

Реальная формула 2026: Сборка из 8×RTX 5090 (~4 млн ₽) выдает в LoRA задачах производительность, сопоставимую с узлом 8×H100 стоимостью свыше 150 млн ₽. Экономия составляет 30–40 раз при минимальных потерях в скорости итераций.

Почему выбрать Elishtech Technology для AI-инфраструктуры

Наличие RTX 5090 и H100 на складе в Москве

Сборка серверов под ключ: от 4 до 10 GPU на узел

Настройка софта: CUDA, PyTorch, vLLM, DeepSpeed

Прямые поставки Blackwell B100/B200

Гарантия на оборудование и 7×24 поддержка

Часто задаваемые вопросы

Хватит ли 32-48 ГБ памяти 5090 для 70B моделей?

Для инференса и QLoRA — да, вполне. Для полноценного дообучения без квантования (FP16) потребуется объединение нескольких карт в один тензор.

Почему H100 стоит в 40 раз дороже?

Из-за HBM3 памяти, поддержки полноценного NVLink для кластерных вычислений и отсутствия драйверных ограничений на Enterprise использование.

Какие сроки поставки GPU в Москву?

RTX 5090 — от 3 дней (в наличии) до 4 недель. H100/H200 — 4-8 недель под заказ.

Нужен мощный сервер для LLM?

Подберем оптимальный стек GPU под ваши задачи и бюджет. Рассчитаем стоимость и сроки за 1 рабочий день!

Получить консультацию и расчет