{"id":16814,"date":"2025-12-18T19:30:00","date_gmt":"2025-12-18T11:30:00","guid":{"rendered":"https:\/\/www.elishtech.com\/?p=16814"},"modified":"2025-12-18T19:30:03","modified_gmt":"2025-12-18T11:30:03","slug":"supermicro-gpu-server-online-inference-low-latency","status":"publish","type":"post","link":"https:\/\/www.elishtech.com\/en\/supermicro-gpu-server-online-inference-low-latency\/","title":{"rendered":"\u041a\u0430\u043a \u0432\u044b\u0431\u0440\u0430\u0442\u044c Supermicro GPU\u2011\u0441\u0435\u0440\u0432\u0435\u0440 \u0434\u043b\u044f \u043e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430: \u043d\u0438\u0437\u043a\u0430\u044f \u0437\u0430\u0434\u0435\u0440\u0436\u043a\u0430 \u0438 \u0432\u044b\u0441\u043e\u043a\u0430\u044f QPS \u0432 \u0440\u043e\u0441\u0441\u0438\u0439\u0441\u043a\u0438\u0445 \u0443\u0441\u043b\u043e\u0432\u0438\u044f\u0445"},"content":{"rendered":"<article class=\"et-article\">\n\n  <h1 class=\"et-title\">\u041e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441 \u0431\u0435\u0437 \u0443\u0437\u043a\u0438\u0445 \u043c\u0435\u0441\u0442: \u043a\u0430\u043a \u0432\u044b\u0431\u0440\u0430\u0442\u044c Supermicro GPU\u2011\u0441\u0435\u0440\u0432\u0435\u0440 \u0434\u043b\u044f \u043d\u0438\u0437\u043a\u043e\u0439 \u0437\u0430\u0434\u0435\u0440\u0436\u043a\u0438 \u0438 \u0432\u044b\u0441\u043e\u043a\u043e\u0439 QPS<\/h1>\n\n  <!-- \u0412\u0441\u0442\u0443\u043f\u043b\u0435\u043d\u0438\u0435: \u043a\u043e\u043d\u0442\u0435\u043a\u0441\u0442 \u0438 \u043e\u0442\u043b\u0438\u0447\u0438\u0435 \u043e\u0442 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f -->\n\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u0414\u043b\u044f \u0440\u043e\u0441\u0441\u0438\u0439\u0441\u043a\u0438\u0445 \u043a\u043e\u043c\u043f\u0430\u043d\u0438\u0439, \u0432\u043d\u0435\u0434\u0440\u044f\u044e\u0449\u0438\u0445 LLM\u2011\u0441\u0435\u0440\u0432\u0438\u0441\u044b, \u043e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441 \u0441\u0442\u0430\u043d\u043e\u0432\u0438\u0442\u0441\u044f \u043a\u0440\u0438\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u043c \u043a\u043e\u043c\u043f\u043e\u043d\u0435\u043d\u0442\u043e\u043c: \u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u0435\u043b\u044e \u043d\u0435 \u0432\u0430\u0436\u043d\u043e, \u043a\u0430\u043a \u0434\u043e\u043b\u0433\u043e \u043e\u0431\u0443\u0447\u0430\u043b\u0430\u0441\u044c \u043c\u043e\u0434\u0435\u043b\u044c, \u043d\u043e \u043b\u044e\u0431\u0430\u044f \u0437\u0430\u0434\u0435\u0440\u0436\u043a\u0430 \u043e\u0442\u0432\u0435\u0442\u0430 \u0431\u043e\u043b\u0435\u0435 200\u2013300 \u043c\u0441 \u043d\u0430\u043f\u0440\u044f\u043c\u0443\u044e \u0431\u044c\u0435\u0442 \u043f\u043e \u043a\u043e\u043d\u0432\u0435\u0440\u0441\u0438\u0438 \u0438 \u0443\u0434\u043e\u0432\u043b\u0435\u0442\u0432\u043e\u0440\u0435\u043d\u043d\u043e\u0441\u0442\u0438.\n  <\/p>\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u0412 \u043e\u0442\u043b\u0438\u0447\u0438\u0435 \u043e\u0442 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f, \u0433\u0434\u0435 \u0432\u0430\u0436\u0435\u043d \u0441\u0443\u043c\u043c\u0430\u0440\u043d\u044b\u0439 \u043e\u0431\u044a\u0451\u043c \u0432\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u0438\u0439 \u0437\u0430 \u043d\u0435\u0434\u0435\u043b\u0438 \u0438\u043b\u0438 \u043c\u0435\u0441\u044f\u0446\u044b, \u043e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441 \u0442\u0440\u0435\u0431\u0443\u0435\u0442 <span class=\"et-highlight\" style=\"background:#fef3c7;color:#92400e;padding:0.12rem 0.4rem;border-radius:4px;font-weight:600;\">\u0437\u0430\u0434\u0435\u0440\u0436\u043a\u0438 &lt; 50 \u043c\u0441 \u0438 \u0443\u0441\u0442\u043e\u0439\u0447\u0438\u0432\u043e\u0439 \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0438 1000+ \u0437\u0430\u043f\u0440\u043e\u0441\u043e\u0432 \u0432 \u0441\u0435\u043a\u0443\u043d\u0434\u0443<\/span>, \u043f\u0440\u0438 \u044d\u0442\u043e\u043c \u043a\u043b\u044e\u0447\u0435\u0432\u044b\u043c KPI \u0441\u0442\u0430\u043d\u043e\u0432\u0438\u0442\u0441\u044f \u0437\u0430\u0433\u0440\u0443\u0437\u043a\u0430 \u043a\u0430\u0436\u0434\u043e\u0439 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e\u0439 GPU \u0438 \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u044c \u0437\u0430\u0433\u0440\u0443\u0437\u043a\u0438 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0432 \u043f\u0430\u043c\u044f\u0442\u044c.\n  <\/p>\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u0423\u043b\u044c\u0442\u0440\u0430\u043f\u043b\u043e\u0442\u043d\u044b\u0435 1U\/2U GPU\u2011\u0441\u0435\u0440\u0432\u0435\u0440\u044b Supermicro, \u0441\u043e\u0431\u0440\u0430\u043d\u043d\u044b\u0435 \u043b\u043e\u043a\u0430\u043b\u044c\u043d\u043e \u0432 \u0420\u043e\u0441\u0441\u0438\u0438 \u043d\u0430 \u043f\u043b\u0430\u0442\u0444\u043e\u0440\u043c\u0435 <span class=\"et-highlight\" style=\"background:#fef3c7;color:#92400e;padding:0.12rem 0.4rem;border-radius:4px;font-weight:600;\">Alt Linux + Proxmox<\/span>, \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u044e\u0442 \u0432 \u0443\u0441\u043b\u043e\u0432\u0438\u044f\u0445 \u0441\u0430\u043d\u043a\u0446\u0438\u0439 \u0441\u043e\u0431\u0440\u0430\u0442\u044c \u043a\u043b\u0430\u0441\u0442\u0435\u0440 \u0437\u0430 &lt; 3 \u043d\u0435\u0434\u0435\u043b\u044c, \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u044c TCO \u043d\u0430 25 % \u043d\u0438\u0436\u0435 \u0442\u0438\u043f\u0438\u0447\u043d\u044b\u0445 OEM\u2011\u0440\u0435\u0448\u0435\u043d\u0438\u0439 \u0438 \u043e\u0431\u0435\u0441\u043f\u0435\u0447\u0438\u0442\u044c \u043f\u043e\u0434\u0434\u0435\u0440\u0436\u043a\u0443 \u043f\u043e\u043b\u043d\u043e\u0433\u043e \u0441\u0442\u0435\u043a\u0430 TensorRT + ONNX Runtime.\n  <\/p>\n\n  <!-- \u0411\u043b\u043e\u043a: \u0442\u0438\u043f\u0438\u0447\u043d\u044b\u0435 \u0432\u043e\u043f\u0440\u043e\u0441\u044b \u0437\u0430\u043a\u0430\u0437\u0447\u0438\u043a\u043e\u0432 -->\n\n  <h2 class=\"et-section-title\">\u0422\u0438\u043f\u0438\u0447\u043d\u044b\u0435 \u0432\u043e\u043f\u0440\u043e\u0441\u044b \u043f\u043e \u043e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0443 LLM<\/h2>\n\n  <ul class=\"et-list\" style=\"margin:1.2rem 0 1.5rem 1.5rem;padding:0;\">\n    <li class=\"et-list-item\" style=\"margin-bottom:0.6rem;color:#374151;font-size:1.05rem;\">\n      \u0425\u0432\u0430\u0442\u0438\u0442 \u043b\u0438 \u043e\u0434\u043d\u043e\u0439 GPU A40 \u0434\u043b\u044f \u043e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 Llama\u20117B\/70B \u0438\u043b\u0438 \u0441\u0440\u0430\u0437\u0443 \u0441\u0442\u0440\u043e\u0438\u0442\u044c \u043a\u043b\u0430\u0441\u0442\u0435\u0440 \u0441 \u0431\u0430\u043b\u0430\u043d\u0441\u0438\u0440\u043e\u0432\u043a\u043e\u0439 \u043d\u0430\u0433\u0440\u0443\u0437\u043a\u0438 \u043c\u0435\u0436\u0434\u0443 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u043c\u0438 GPU?\n    <\/li>\n    <li class=\"et-list-item\" style=\"margin-bottom:0.6rem;color:#374151;font-size:1.05rem;\">\n      \u0427\u0442\u043e \u044d\u0444\u0444\u0435\u043a\u0442\u0438\u0432\u043d\u0435\u0435 \u043f\u043e QPS\/\u0412\u0442 \u0438 QPS\/\u0440\u0443\u0431\u043b\u044c: H100 \u0438\u043b\u0438 \u0431\u043e\u043b\u0435\u0435 \u043c\u0430\u0441\u0441\u043e\u0432\u044b\u0435 A40\/A6000, \u0435\u0441\u043b\u0438 \u0440\u0435\u0447\u044c \u0438\u0434\u0435\u0442 \u043e \u0431\u043e\u0435\u0432\u043e\u043c \u0441\u0435\u0440\u0432\u0438\u0441\u0435 \u0441 \u0436\u0435\u0441\u0442\u043a\u0438\u043c\u0438 SLA?\n    <\/li>\n    <li class=\"et-list-item\" style=\"margin-bottom:0.6rem;color:#374151;font-size:1.05rem;\">\n      \u041a\u0430\u043a \u0434\u043e\u0431\u0438\u0442\u044c\u0441\u044f \u0432\u0440\u0435\u043c\u0435\u043d\u0438 \u0445\u043e\u043b\u043e\u0434\u043d\u043e\u0439 \u0437\u0430\u0433\u0440\u0443\u0437\u043a\u0438 \u043c\u043e\u0434\u0435\u043b\u0438 &lt; 10 \u0441\u0435\u043a\u0443\u043d\u0434 \u0438 \u043a\u0430\u043a\u0438\u0435 \u0442\u0440\u0435\u0431\u043e\u0432\u0430\u043d\u0438\u044f \u043a NVMe\u2011\u043a\u044d\u0448\u0443 \u0438 \u043f\u0440\u043e\u043f\u0443\u0441\u043a\u043d\u043e\u0439 \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u0438 \u0434\u0438\u0441\u043a\u043e\u0432\u043e\u0433\u043e \u043c\u0430\u0441\u0441\u0438\u0432\u0430?\n    <\/li>\n    <li class=\"et-list-item\" style=\"margin-bottom:0.6rem;color:#374151;font-size:1.05rem;\">\n      \u041a\u0430\u043a \u0432\u044b\u0434\u0435\u0440\u0436\u0430\u0442\u044c 1000+ QPS \u0431\u0435\u0437 \u0441\u0435\u0442\u0435\u0432\u044b\u0445 \u0443\u0437\u043a\u0438\u0445 \u043c\u0435\u0441\u0442: \u0434\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u043e \u043b\u0438 25GbE, \u0438\u043b\u0438 \u0434\u043b\u044f \u0441\u0442\u0430\u0431\u0438\u043b\u044c\u043d\u043e\u0433\u043e p99 \u043d\u0443\u0436\u0435\u043d 100GbE \u0438 RDMA?\n    <\/li>\n    <li class=\"et-list-item\" style=\"margin-bottom:0.6rem;color:#374151;font-size:1.05rem;\">\n      \u041a\u0430\u043a\u043e\u0432\u044b \u0440\u0435\u0430\u043b\u044c\u043d\u044b\u0435 \u0441\u0440\u043e\u043a\u0438 \u043f\u043e\u0441\u0442\u0430\u0432\u043a\u0438 A40 \u0432 \u0443\u0441\u043b\u043e\u0432\u0438\u044f\u0445 \u0441\u0430\u043d\u043a\u0446\u0438\u0439, \u0438 \u043c\u043e\u0436\u043d\u043e \u043b\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c RTX 4090 \u043a\u0430\u043a \u0437\u0430\u043c\u0435\u043d\u0443 \u0432 \u043f\u0440\u043e\u0434\u0430\u043a\u0448\u0435\u043d\u0435?\n    <\/li>\n    <li class=\"et-list-item\" style=\"margin-bottom:0.6rem;color:#374151;font-size:1.05rem;\">\n      \u041a\u0430\u043a \u043e\u0440\u0433\u0430\u043d\u0438\u0437\u043e\u0432\u0430\u0442\u044c \u0438\u0437\u043e\u043b\u044f\u0446\u0438\u044e \u0430\u0440\u0435\u043d\u0434\u0430\u0442\u043e\u0440\u043e\u0432: \u0447\u0435\u0440\u0435\u0437 \u0430\u043f\u043f\u0430\u0440\u0430\u0442\u043d\u044b\u0439 vGPU\/MIG \u0438\u043b\u0438 \u0434\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u043e Docker + Kubernetes \u043d\u0430 \u0443\u0440\u043e\u0432\u043d\u0435 \u043a\u043e\u043d\u0442\u0435\u0439\u043d\u0435\u0440\u043e\u0432 \u0438 \u043f\u0440\u043e\u0441\u0442\u0440\u0430\u043d\u0441\u0442\u0432 \u0438\u043c\u0451\u043d?\n    <\/li>\n    <li class=\"et-list-item\" style=\"margin-bottom:0.6rem;color:#374151;font-size:1.05rem;\">\n      \u041a\u0430\u043a\u0438\u0435 \u0446\u0435\u043b\u0435\u0432\u044b\u0435 \u043c\u0435\u0442\u0440\u0438\u043a\u0438 \u043c\u043e\u043d\u0438\u0442\u043e\u0440\u0438\u043d\u0433\u0430 \u0441\u0447\u0438\u0442\u0430\u0442\u044c \u00ab\u0437\u0435\u043b\u0435\u043d\u044b\u043c\u0438\u00bb: \u0437\u0430\u0433\u0440\u0443\u0437\u043a\u0430 GPU, p99 \u0437\u0430\u0434\u0435\u0440\u0436\u043a\u0438, \u043e\u0448\u0438\u0431\u043a\u0438 \u0434\u0435\u043a\u043e\u0434\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u044f, saturation \u0441\u0435\u0442\u0438?\n    <\/li>\n    <li class=\"et-list-item\" style=\"margin-bottom:0.6rem;color:#374151;font-size:1.05rem;\">\n      \u0427\u0442\u043e \u0434\u0430\u0435\u0442 1U\/2U\u2011\u0444\u043e\u0440\u043c\u2011\u0444\u0430\u043a\u0442\u043e\u0440 \u043f\u043e \u0441\u0440\u0430\u0432\u043d\u0435\u043d\u0438\u044e \u0441 4U\u2011\u00ab\u0442\u0440\u0435\u043d\u0438\u0440\u043e\u0432\u043e\u0447\u043d\u044b\u043c\u0438\u00bb \u0441\u0435\u0440\u0432\u0435\u0440\u0430\u043c\u0438, \u0435\u0441\u043b\u0438 \u043d\u0443\u0436\u0435\u043d \u043c\u0430\u043a\u0441\u0438\u043c\u0443\u043c QPS \u043d\u0430 \u0441\u0442\u043e\u0439\u043a\u0443?\n    <\/li>\n  <\/ul>\n\n  <!-- \u0411\u043b\u043e\u043a: \u0431\u0430\u0437\u043e\u0432\u044b\u0435 \u043f\u0440\u0438\u043d\u0446\u0438\u043f\u044b \u043e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 -->\n\n  <h2 class=\"et-section-title\">\u041a\u043b\u044e\u0447\u0435\u0432\u044b\u0435 \u043c\u0435\u0442\u0440\u0438\u043a\u0438: \u043d\u0435 \u0442\u043e\u043b\u044c\u043a\u043e FLOPS, \u043d\u043e \u0438 QPS<\/h2>\n\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u0412 \u0437\u0430\u0434\u0430\u0447\u0430\u0445 \u043e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u043e\u0441\u043d\u043e\u0432\u043d\u044b\u043c\u0438 \u0446\u0435\u043b\u0435\u0432\u044b\u043c\u0438 \u043c\u0435\u0442\u0440\u0438\u043a\u0430\u043c\u0438 \u0441\u0442\u0430\u043d\u043e\u0432\u044f\u0442\u0441\u044f <span class=\"et-highlight\" style=\"background:#fef3c7;color:#92400e;padding:0.12rem 0.4rem;border-radius:4px;font-weight:600;\">p50\/p95\/p99 \u0437\u0430\u0434\u0435\u0440\u0436\u043a\u0438, \u0441\u0442\u0430\u0431\u0438\u043b\u044c\u043d\u044b\u0439 QPS \u0438 \u0437\u0430\u0433\u0440\u0443\u0437\u043a\u0430 GPU &gt; 90 %<\/span> \u043f\u0440\u0438 \u0441\u043e\u0445\u0440\u0430\u043d\u0435\u043d\u0438\u0438 \u0440\u0435\u0437\u0435\u0440\u0432\u0430 \u043f\u043e \u043f\u0430\u043c\u044f\u0442\u0438 \u0438 \u0441\u0435\u0442\u0435\u0432\u044b\u043c \u0440\u0435\u0441\u0443\u0440\u0441\u0430\u043c \u0434\u043b\u044f \u043f\u0438\u043a\u043e\u0432\u043e\u0433\u043e \u0442\u0440\u0430\u0444\u0438\u043a\u0430.\n  <\/p>\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u0412\u044b\u0447\u0438\u0441\u043b\u0438\u0442\u0435\u043b\u044c\u043d\u0430\u044f \u043c\u043e\u0449\u043d\u043e\u0441\u0442\u044c \u0432 TFLOPS \u0432\u0430\u0436\u043d\u0430, \u043d\u043e \u0431\u0435\u0437 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0438\u0440\u043e\u0432\u0430\u043d\u043d\u043e\u0433\u043e \u0441\u0442\u0435\u043a\u0430 TensorRT\/ONNX, NVMe\u2011\u043a\u044d\u0448\u0430 \u0438 \u043a\u043e\u0440\u0440\u0435\u043a\u0442\u043d\u043e \u0441\u043f\u0440\u043e\u0435\u043a\u0442\u0438\u0440\u043e\u0432\u0430\u043d\u043d\u043e\u0439 \u0441\u0435\u0442\u0438 \u0434\u0430\u0436\u0435 \u0444\u043b\u0430\u0433\u043c\u0430\u043d\u0441\u043a\u0438\u0439 H100 \u043d\u0435 \u0434\u0430\u0441\u0442 \u043e\u0436\u0438\u0434\u0430\u0435\u043c\u043e\u0439 \u043e\u0442\u0434\u0430\u0447\u0438 \u043f\u043e QPS \u0438 \u043f\u0440\u0438\u0432\u0435\u0434\u0435\u0442 \u043a \u0437\u0430\u0432\u044b\u0448\u0435\u043d\u043d\u043e\u043c\u0443 3\u2011\u043b\u0435\u0442\u043d\u0435\u043c\u0443 TCO.\n  <\/p>\n\n  <!-- \u0411\u043b\u043e\u043a: \u0442\u0440\u0451\u0445\u0443\u0440\u043e\u0432\u043d\u0435\u0432\u043e\u0435 \u0434\u0435\u043b\u0435\u043d\u0438\u0435 \u043f\u043e \u043c\u0430\u0441\u0448\u0442\u0430\u0431\u0443 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 -->\n\n  <h2 class=\"et-section-title\">\u0422\u0440\u0438 \u0443\u0440\u043e\u0432\u043d\u044f \u0437\u0430\u0434\u0430\u0447 \u043e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430<\/h2>\n\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u0414\u043b\u044f \u043f\u0440\u0430\u043a\u0442\u0438\u0447\u0435\u0441\u043a\u043e\u0439 \u0430\u0440\u0445\u0438\u0442\u0435\u043a\u0442\u0443\u0440\u044b \u0443\u0434\u043e\u0431\u043d\u043e \u0434\u0435\u043b\u0438\u0442\u044c \u043e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441 LLM \u043d\u0430 \u0442\u0440\u0438 \u043a\u043b\u0430\u0441\u0441\u0430 \u0437\u0430\u0434\u0430\u0447: \u043b\u0435\u0433\u043a\u0438\u0435 \u043c\u043e\u0434\u0435\u043b\u0438 \u0434\u043e 13B, \u0441\u0440\u0435\u0434\u043d\u0438\u0439 \u0434\u0438\u0430\u043f\u0430\u0437\u043e\u043d 13\u201370B \u0438 \u043a\u0440\u0443\u043f\u043d\u044b\u0435 \u043c\u043e\u0434\u0435\u043b\u0438 &gt; 70B, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0442\u0440\u0435\u0431\u0443\u044e\u0442 \u043a\u043e\u043d\u0432\u0435\u0439\u0435\u0440\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0430\u0440\u0430\u043b\u043b\u0435\u043b\u0438\u0432\u0430\u043d\u0438\u044f \u043f\u043e \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u043c GPU.\n  <\/p>\n\n  <table class=\"et-table\" style=\"width:100%;border-collapse:collapse;margin-bottom:1.8rem;font-size:0.98rem;color:#111827;\">\n    <thead>\n      <tr style=\"background:linear-gradient(135deg,#2563eb,#1d4ed8);\">\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u041a\u043b\u0430\u0441\u0441 \u043d\u0430\u0433\u0440\u0443\u0437\u043a\u0438<\/th>\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u041c\u0430\u0441\u0448\u0442\u0430\u0431 \u043c\u043e\u0434\u0435\u043b\u0438<\/th>\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u0426\u0435\u043b\u044c \u043f\u043e QPS<\/th>\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u0426\u0435\u043b\u044c \u043f\u043e \u0437\u0430\u0434\u0435\u0440\u0436\u043a\u0435<\/th>\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u0422\u0438\u043f\u043e\u0432\u0430\u044f \u0442\u043e\u043f\u043e\u043b\u043e\u0433\u0438\u044f<\/th>\n      <\/tr>\n    <\/thead>\n    <tbody>\n      <tr style=\"background:#e0edff;\">\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">\u041b\u0435\u0433\u043a\u0438\u0439 \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">&lt; 13B<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">\u0414\u043e 100 QPS \u043d\u0430 \u0441\u0435\u0440\u0432\u0438\u0441<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">p95 &lt; 50 \u043c\u0441<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">1U, 1\u20132 GPU A40, \u043b\u043e\u043a\u0430\u043b\u044c\u043d\u044b\u0439 NVMe\u2011\u043a\u044d\u0448<\/td>\n      <\/tr>\n      <tr style=\"background:#f1f5ff;\">\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">\u0421\u0440\u0435\u0434\u043d\u0438\u0439 \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">13\u201370B<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">\u0414\u043e 500 QPS \u043d\u0430 \u043a\u043b\u0430\u0441\u0442\u0435\u0440<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">p95 &lt; 70 \u043c\u0441<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">2U, 2\u20134 GPU A40\/A6000, 25\u2013100GbE<\/td>\n      <\/tr>\n      <tr style=\"background:#e0edff;\">\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">\u041a\u0440\u0443\u043f\u043d\u044b\u0435 \u043c\u043e\u0434\u0435\u043b\u0438<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">&gt; 70B<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">1000+ QPS (\u043a\u043b\u0430\u0441\u0442\u0435\u0440)<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">p95 &lt; 100 \u043c\u0441<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">4U, 8 GPU, pipeline\/tensor parallel<\/td>\n      <\/tr>\n    <\/tbody>\n  <\/table>\n\n  <!-- \u0411\u043b\u043e\u043a: \u0442\u0440\u0435\u0445\u0443\u0440\u043e\u0432\u043d\u0435\u0432\u0430\u044f \u043b\u0438\u043d\u0435\u0439\u043a\u0430 Supermicro (1U\/2U\/4U) -->\n\n  <h2 class=\"et-section-title\">\u041b\u0438\u043d\u0435\u0439\u043a\u0430 Supermicro \u0434\u043b\u044f \u043e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430<\/h2>\n\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u0414\u043b\u044f \u043e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 LLM \u0443\u0434\u043e\u0431\u043d\u043e \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u0442\u0440\u0435\u0445\u0443\u0440\u043e\u0432\u043d\u0435\u0432\u0443\u044e \u043b\u0438\u043d\u0435\u0439\u043a\u0443 Supermicro: 1U \u0434\u043b\u044f \u043b\u0435\u0433\u043a\u0438\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0438 edge\u2011\u0441\u0446\u0435\u043d\u0430\u0440\u0438\u0435\u0432, 2U \u0434\u043b\u044f \u0441\u0440\u0435\u0434\u043d\u0438\u0445 \u043d\u0430\u0433\u0440\u0443\u0437\u043e\u043a \u0438 4U \u0434\u043b\u044f \u043a\u0440\u0443\u043f\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0441 \u043a\u043e\u043d\u0432\u0435\u0439\u0435\u0440\u043d\u044b\u043c \u0440\u0430\u0441\u043f\u0430\u0440\u0430\u043b\u043b\u0435\u043b\u0438\u0432\u0430\u043d\u0438\u0435\u043c \u0438 \u0432\u044b\u0441\u043e\u043a\u0438\u043c QPS.\n  <\/p>\n\n  <table class=\"et-table\" style=\"width:100%;border-collapse:collapse;margin-bottom:1.8rem;font-size:0.98rem;color:#111827;\">\n    <thead>\n      <tr style=\"background:linear-gradient(135deg,#2563eb,#1d4ed8);\">\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u0421\u0446\u0435\u043d\u0430\u0440\u0438\u0439<\/th>\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u0420\u0435\u043a\u043e\u043c\u0435\u043d\u0434\u0443\u0435\u043c\u044b\u0439 \u0441\u0435\u0440\u0432\u0435\u0440<\/th>\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">Graphics<\/th>\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">CPU \/ \u041e\u0417\u0423<\/th>\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u0421\u0435\u0442\u044c \/ \u0445\u0440\u0430\u043d\u0438\u043b\u0438\u0449\u0435<\/th>\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u041c\u043e\u0449\u043d\u043e\u0441\u0442\u044c \/ \u0431\u044e\u0434\u0436\u0435\u0442<\/th>\n      <\/tr>\n    <\/thead>\n    <tbody>\n      <tr style=\"background:#e0edff;\">\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">&lt; 13B, \u0434\u043e 100 QPS<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">SYS\u20111029GQ\u2011TRT (1U)<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">2\u20134\u00d7 NVIDIA A40 48 GB<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">Intel Xeon, \u0434\u043e 512 GB DDR4\/DDR5<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">2\u00d7 25GbE, \u0434\u043e 8\u00d7 NVMe<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">\u0414\u043e 1600 W, \u043e\u0440\u0438\u0435\u043d\u0442\u0438\u0440 400\u2013600 \u0442\u044b\u0441. \u0440\u0443\u0431.<\/td>\n      <\/tr>\n      <tr style=\"background:#f1f5ff;\">\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">13\u201370B, \u0434\u043e 500 QPS<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">SYS\u20112029GP\u2011TRT (2U)<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">4\u00d7 NVIDIA A6000 48 GB \u0438\u043b\u0438 A40<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">2\u00d7 AMD EPYC, \u0434\u043e 1 TB \u041e\u0417\u0423<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">2\u00d7 100GbE, \u0434\u043e 16\u00d7 NVMe<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">\u0414\u043e 2000 W, \u043e\u0440\u0438\u0435\u043d\u0442\u0438\u0440 700\u2013900 \u0442\u044b\u0441. \u0440\u0443\u0431.<\/td>\n      <\/tr>\n      <tr style=\"background:#e0edff;\">\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">&gt; 70B, 1000+ QPS<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">SYS\u20114029GP\u2011TRT (4U)<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">8\u00d7 NVIDIA H100 PCIe (\u0438\u043b\u0438 \u0433\u0438\u0431\u0440\u0438\u0434)<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">2\u00d7 Xeon, \u0434\u043e 2 TB \u041e\u0417\u0423<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">4\u00d7 100GbE, \u0434\u043e 24\u00d7 NVMe<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">\u0414\u043e 3000 W (\u0436\u0438\u0434\u043a\u043e\u0441\u0442\u043d\u043e\u0435 \u043e\u0445\u043b\u0430\u0436\u0434\u0435\u043d\u0438\u0435), \u043e\u0440\u0438\u0435\u043d\u0442\u0438\u0440 1,2\u20131,6 \u043c\u043b\u043d \u0440\u0443\u0431.<\/td>\n      <\/tr>\n    <\/tbody>\n  <\/table>\n\n  <!-- \u0424\u043e\u0440\u043c\u0443\u043b\u0430 \u043f\u043e\u0434\u0431\u043e\u0440\u0430 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u0430 GPU \u043f\u043e QPS -->\n\n  <h2 class=\"et-section-title\">\u0424\u043e\u0440\u043c\u0443\u043b\u0430 \u043f\u043e\u0434\u0431\u043e\u0440\u0430: GPU \u0438\u0437 QPS \u0438 \u0437\u0430\u0434\u0435\u0440\u0436\u043a\u0438<\/h2>\n\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u0412 \u043e\u0442\u043b\u0438\u0447\u0438\u0435 \u043e\u0442 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f, \u0433\u0434\u0435 \u0447\u0438\u0441\u043b\u043e GPU \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u044f\u0435\u0442\u0441\u044f \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u0430\u043c\u0438 \u043c\u043e\u0434\u0435\u043b\u0438 \u0438 batch\u2011\u0440\u0430\u0437\u043c\u0435\u0440\u043e\u043c, \u0432 \u043e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043d\u043e\u0439 \u0442\u043e\u0447\u043a\u043e\u0439 \u044f\u0432\u043b\u044f\u044e\u0442\u0441\u044f \u0446\u0435\u043b\u0435\u0432\u044b\u0435 QPS \u0438 \u0441\u0440\u0435\u0434\u043d\u044f\u044f \u0434\u043b\u0438\u043d\u0430 \u043e\u0442\u0432\u0435\u0442\u0430 \u0432 \u0442\u043e\u043a\u0435\u043d\u0430\u0445, \u0430 \u0442\u0430\u043a\u0436\u0435 \u0440\u0435\u0430\u043b\u044c\u043d\u0430\u044f \u043f\u0440\u043e\u043f\u0443\u0441\u043a\u043d\u0430\u044f \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u044c \u043e\u0434\u043d\u043e\u0439 GPU \u043f\u043e \u0442\u043e\u043a\u0435\u043d\u0430\u043c \u0432 \u0441\u0435\u043a\u0443\u043d\u0434\u0443.\n  <\/p>\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u041f\u0440\u0438\u0431\u043b\u0438\u0436\u0435\u043d\u043d\u0430\u044f \u0444\u043e\u0440\u043c\u0443\u043b\u0430 \u0432\u044b\u0433\u043b\u044f\u0434\u0438\u0442 \u0442\u0430\u043a: <span class=\"et-highlight\" style=\"background:#fef3c7;color:#92400e;padding:0.12rem 0.4rem;border-radius:4px;font-weight:600;\">GPU = \u2308(QPS \u00d7 avg_tokens\/s) \u00f7 throughput_GPU\u2309 \u00d7 1,3<\/span>, \u0433\u0434\u0435 \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442 1,3 \u0437\u0430\u043a\u043b\u0430\u0434\u044b\u0432\u0430\u0435\u0442 \u0440\u0435\u0437\u0435\u0440\u0432 \u043d\u0430 \u043f\u0438\u043a\u0438 \u043d\u0430\u0433\u0440\u0443\u0437\u043a\u0438, \u0434\u0435\u0433\u0440\u0430\u0434\u0430\u0446\u0438\u044e \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0441\u0442\u0438 \u0438 \u043d\u0435\u043f\u0440\u0435\u0434\u0432\u0438\u0434\u0435\u043d\u043d\u044b\u0439 \u0440\u043e\u0441\u0442 \u0442\u0440\u0430\u0444\u0438\u043a\u0430.\n  <\/p>\n\n  <h2 class=\"et-section-title\">\u041f\u0440\u0438\u043c\u0435\u0440: 500 QPS \u0434\u043b\u044f Llama\u201170B<\/h2>\n\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u0414\u043b\u044f \u0441\u0435\u0440\u0432\u0438\u0441\u0430 \u0441 \u0446\u0435\u043b\u0435\u0432\u044b\u043c\u0438 500 QPS \u0438 \u0441\u0440\u0435\u0434\u043d\u0435\u0439 \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u044c\u044e \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0438 50 \u0442\u043e\u043a\u0435\u043d\u043e\u0432 \u0432 \u0441\u0435\u043a\u0443\u043d\u0434\u0443 \u043d\u0430 \u0437\u0430\u043f\u0440\u043e\u0441 \u043f\u0440\u0438 \u043f\u0440\u043e\u043f\u0443\u0441\u043a\u043d\u043e\u0439 \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u0438 \u043e\u0434\u043d\u043e\u0439 A40 \u043f\u043e\u0440\u044f\u0434\u043a\u0430 200 \u0442\u043e\u043a\u0435\u043d\u043e\u0432\/\u0441 \u0440\u0430\u0441\u0447\u0435\u0442 \u0434\u0430\u0435\u0442 \u043e\u043a\u043e\u043b\u043e 13 GPU, \u0447\u0442\u043e \u0443\u0434\u043e\u0431\u043d\u043e \u0440\u0435\u0430\u043b\u0438\u0437\u0443\u0435\u0442\u0441\u044f \u043a\u0430\u043a \u043a\u043b\u0430\u0441\u0442\u0435\u0440 \u0438\u0437 \u0447\u0435\u0442\u044b\u0440\u0435\u0445 \u0443\u0437\u043b\u043e\u0432 \u043f\u043e 4 GPU \u0441 \u043d\u0435\u0431\u043e\u043b\u044c\u0448\u0438\u043c \u0437\u0430\u043f\u0430\u0441\u043e\u043c.\n  <\/p>\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u0422\u0430\u043a\u0430\u044f \u043a\u043e\u043d\u0444\u0438\u0433\u0443\u0440\u0430\u0446\u0438\u044f \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u0435\u0442 \u0432\u044b\u0434\u0435\u0440\u0436\u0438\u0432\u0430\u0442\u044c \u0440\u043e\u0441\u0442 \u043d\u0430\u0433\u0440\u0443\u0437\u043a\u0438, \u043f\u0440\u043e\u0432\u043e\u0434\u0438\u0442\u044c A\/B\u2011\u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u044b \u0441 \u043d\u043e\u0432\u044b\u043c\u0438 \u0432\u0435\u0440\u0441\u0438\u044f\u043c\u0438 \u043c\u043e\u0434\u0435\u043b\u0438 \u0438 \u0432\u044b\u043f\u043e\u043b\u043d\u044f\u0442\u044c \u043f\u043b\u0430\u043d\u043e\u0432\u044b\u0435 \u043e\u0431\u043d\u043e\u0432\u043b\u0435\u043d\u0438\u044f \u0431\u0435\u0437 \u043f\u0430\u0434\u0435\u043d\u0438\u044f QPS \u043d\u0438\u0436\u0435 SLA.\n  <\/p>\n\n  <!-- \u0411\u043b\u043e\u043a: \u043f\u0440\u043e\u0433\u0440\u0430\u043c\u043c\u043d\u0430\u044f \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0446\u0438\u044f (TensorRT\/ONNX) -->\n\n  <h2 class=\"et-section-title\">\u041e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0446\u0438\u044f \u0437\u0430\u0434\u0435\u0440\u0436\u043a\u0438: TensorRT \u0438 ONNX Runtime<\/h2>\n\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u0418\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0435 TensorRT \u0434\u043b\u044f \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0446\u0438\u0438 \u0433\u0440\u0430\u0444\u0430 \u0438 INT8\u2011\u043a\u0432\u0430\u043d\u0442\u043e\u0432\u0430\u043d\u0438\u044f \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u0435\u0442 \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u0435 \u0434\u043e 3\u20135 \u0440\u0430\u0437 \u043f\u043e \u0441\u0440\u0430\u0432\u043d\u0435\u043d\u0438\u044e \u0441 \u00ab\u0447\u0438\u0441\u0442\u044b\u043c\u00bb PyTorch\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u043e\u043c, \u043f\u0440\u0438\u0432\u043e\u0434\u044f \u0437\u0430\u0434\u0435\u0440\u0436\u043a\u0443 Llama\u20117B \u043d\u0430 A40 \u043a \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f\u043c &lt; 20 \u043c\u0441 \u043f\u0440\u0438 \u0433\u0440\u0430\u043c\u043e\u0442\u043d\u043e\u0439 \u043d\u0430\u0441\u0442\u0440\u043e\u0439\u043a\u0435 batch \u0438 \u0441\u0442\u0435\u043a\u0430.\n  <\/p>\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    ONNX Runtime \u043e\u0431\u0435\u0441\u043f\u0435\u0447\u0438\u0432\u0430\u0435\u0442 \u0443\u043d\u0438\u0444\u0438\u0446\u0438\u0440\u043e\u0432\u0430\u043d\u043d\u044b\u0439 \u0441\u043b\u043e\u0439 \u043c\u0435\u0436\u0434\u0443 \u0444\u0440\u0435\u0439\u043c\u0432\u043e\u0440\u043a\u0430\u043c\u0438 \u0438 GPU\u2011\u043f\u043e\u043a\u043e\u043b\u0435\u043d\u0438\u044f\u043c\u0438: \u043e\u0434\u0438\u043d \u0438 \u0442\u043e\u0442 \u0436\u0435 \u0433\u0440\u0430\u0444 \u043c\u043e\u0436\u043d\u043e \u043f\u0435\u0440\u0435\u043d\u043e\u0441\u0438\u0442\u044c \u0441 A40 \u043d\u0430 H100 \u0431\u0435\u0437 \u043f\u043e\u043b\u043d\u043e\u0439 \u043f\u0435\u0440\u0435\u0440\u0430\u0431\u043e\u0442\u043a\u0438 \u0441\u0435\u0440\u0432\u0438\u0441\u0430, \u0447\u0442\u043e \u043a\u0440\u0438\u0442\u0438\u0447\u043d\u043e \u0432 \u0443\u0441\u043b\u043e\u0432\u0438\u044f\u0445 \u0441\u0430\u043d\u043a\u0446\u0438\u0439 \u0438 \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e\u0441\u0442\u0438 \u0433\u0438\u0431\u043a\u043e \u043c\u0435\u043d\u044f\u0442\u044c \u0436\u0435\u043b\u0435\u0437\u043e.\n  <\/p>\n\n  <!-- \u0411\u043b\u043e\u043a: \u043f\u0430\u043c\u044f\u0442\u044c \u0438 NVMe\u2011\u043a\u044d\u0448 -->\n\n  <h2 class=\"et-section-title\">\u041f\u0430\u043c\u044f\u0442\u044c \u0438 NVMe\u2011\u043a\u044d\u0448: \u0431\u043e\u0440\u044c\u0431\u0430 \u0437\u0430 \u043c\u0438\u043b\u043b\u0438\u0441\u0435\u043a\u0443\u043d\u0434\u044b<\/h2>\n\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u0414\u043b\u044f \u043e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u0432\u0430\u0436\u043d\u043e, \u0447\u0442\u043e\u0431\u044b \u043d\u0435 \u0442\u043e\u043b\u044c\u043a\u043e \u0441\u0430\u043c\u0430 \u043c\u043e\u0434\u0435\u043b\u044c, \u043d\u043e \u0438 \u0435\u0451 KV\u2011\u043a\u0435\u0448 \u0443\u043c\u0435\u0449\u0430\u043b\u0438\u0441\u044c \u0432 \u041e\u0417\u0423 \u0438 GPU\u2011\u043f\u0430\u043c\u044f\u0442\u0438 \u0431\u0435\u0437 \u043f\u043e\u0441\u0442\u043e\u044f\u043d\u043d\u044b\u0445 \u0432\u044b\u0433\u0440\u0443\u0437\u043e\u043a, \u0438\u043d\u0430\u0447\u0435 \u0445\u0432\u043e\u0441\u0442\u043e\u0432\u0430\u044f \u0437\u0430\u0434\u0435\u0440\u0436\u043a\u0430 \u0440\u0435\u0437\u043a\u043e \u0440\u0430\u0441\u0442\u0435\u0442 \u0438\u0437\u2011\u0437\u0430 \u043b\u0438\u0448\u043d\u0438\u0445 \u043e\u043f\u0435\u0440\u0430\u0446\u0438\u0439 \u0432\u0432\u043e\u0434\u0430\u2011\u0432\u044b\u0432\u043e\u0434\u0430 \u0438 \u0430\u043b\u043b\u043e\u043a\u0430\u0446\u0438\u0439.\n  <\/p>\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u041e\u0446\u0435\u043d\u043a\u0443 \u043c\u043e\u0436\u043d\u043e \u0432\u044b\u0440\u0430\u0437\u0438\u0442\u044c \u0444\u043e\u0440\u043c\u0443\u043b\u043e\u0439: <span class=\"et-highlight\" style=\"background:#fef3c7;color:#92400e;padding:0.12rem 0.4rem;border-radius:4px;font-weight:600;\">RAM_\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 = FP16\u2011\u043c\u043e\u0434\u0435\u043b\u044c (\u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u044b \u00d7 2 \u0431\u0430\u0439\u0442\u0430) + KV\u2011\u043a\u0435\u0448 (batch \u00d7 seq_len \u00d7 \u0447\u0438\u0441\u043b\u043e \u0441\u043b\u043e\u0451\u0432 \u00d7 80 \u0431\u0430\u0439\u0442)<\/span>, \u0438\u0437 \u043a\u043e\u0442\u043e\u0440\u043e\u0439 \u0434\u043b\u044f Llama\u201170B \u043f\u0440\u0438 batch=128 \u0438 seq_len=2048 \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0441\u044f \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e\u0441\u0442\u044c \u043f\u043e\u0440\u044f\u0434\u043a\u0430 1,2 TB DDR5.\n  <\/p>\n\n  <h2 class=\"et-section-title\">NVMe\u2011\u043a\u044d\u0448 \u0438 \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u044c \u0437\u0430\u0433\u0440\u0443\u0437\u043a\u0438 \u043c\u043e\u0434\u0435\u043b\u0438<\/h2>\n\n  <table class=\"et-table\" style=\"width:100%;border-collapse:collapse;margin-bottom:1.8rem;font-size:0.98rem;color:#111827;\">\n    <thead>\n      <tr style=\"background:linear-gradient(135deg,#2563eb,#1d4ed8);\">\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u0426\u0435\u043b\u0435\u0432\u043e\u0439 QPS<\/th>\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u0421\u0445\u0435\u043c\u0430 NVMe<\/th>\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u0401\u043c\u043a\u043e\u0441\u0442\u044c \u043a\u044d\u0448\u0430<\/th>\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u0412\u0440\u0435\u043c\u044f \u0437\u0430\u0433\u0440\u0443\u0437\u043a\u0438 \u043c\u043e\u0434\u0435\u043b\u0438<\/th>\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u0420\u0435\u043a\u043e\u043c\u0435\u043d\u0434\u043e\u0432\u0430\u043d\u043d\u044b\u0439 \u043a\u043b\u0430\u0441\u0441 SSD<\/th>\n      <\/tr>\n    <\/thead>\n    <tbody>\n      <tr style=\"background:#e0edff;\">\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">\u0414\u043e 100 QPS<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">4\u00d7 NVMe Gen4, RAID0<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">8 TB<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">&lt; 5 \u0441<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">Enterprise\u2011\u043a\u043b\u0430\u0441\u0441 (\u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, PM1743)<\/td>\n      <\/tr>\n      <tr style=\"background:#f1f5ff;\">\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">\u0414\u043e 500 QPS<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">8\u00d7 NVMe Gen5, RAID0<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">16 TB<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">&lt; 3 \u0441<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">\u0412\u044b\u0441\u043e\u043a\u043e\u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0435 \u043c\u043e\u0434\u0435\u043b\u0438 (\u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, 7500 MAX)<\/td>\n      <\/tr>\n      <tr style=\"background:#e0edff;\">\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">1000+ QPS<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">NVMe\u2011oF\u2011\u043f\u0443\u043b<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">50 TB \u0438 \u0431\u043e\u043b\u0435\u0435<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">&lt; 1 \u0441<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">NVMe\u2011\u043d\u0430\u043a\u043e\u043f\u0438\u0442\u0435\u043b\u0438 \u0434\u0430\u0442\u0430\u2011\u0446\u0435\u043d\u0442\u0440\u043e\u0432\u043e\u0433\u043e \u043a\u043b\u0430\u0441\u0441\u0430<\/td>\n      <\/tr>\n    <\/tbody>\n  <\/table>\n\n  <!-- \u0411\u043b\u043e\u043a: \u0441\u0435\u0442\u044c \u0438 QPS -->\n\n  <h2 class=\"et-section-title\">\u0421\u0435\u0442\u0435\u0432\u0430\u044f \u0430\u0440\u0445\u0438\u0442\u0435\u043a\u0442\u0443\u0440\u0430 \u0434\u043b\u044f QPS 1000+<\/h2>\n\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u0414\u043b\u044f QPS \u0434\u043e 500 \u043d\u0430 \u043a\u043b\u0430\u0441\u0442\u0435\u0440 \u0447\u0430\u0441\u0442\u043e \u0434\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u043e 25GbE c RoCEv2 \u0438 \u043d\u0443\u043b\u0435\u0432\u043e\u0439 \u043a\u043e\u043f\u0438\u0435\u0439 \u043f\u0440\u0438 \u043f\u0440\u0430\u0432\u0438\u043b\u044c\u043d\u043e \u043d\u0430\u0441\u0442\u0440\u043e\u0435\u043d\u043d\u044b\u0445 \u043e\u0447\u0435\u0440\u0435\u0434\u044f\u0445 \u0438 \u0431\u0443\u0444\u0435\u0440\u0430\u0445, \u043e\u0434\u043d\u0430\u043a\u043e \u043f\u0440\u0438 500+ QPS \u0443\u0437\u043a\u0438\u043c \u043c\u0435\u0441\u0442\u043e\u043c \u0441\u0442\u0430\u043d\u043e\u0432\u0438\u0442\u0441\u044f \u043d\u0435 \u0442\u043e\u043b\u044c\u043a\u043e \u043f\u0440\u043e\u043f\u0443\u0441\u043a\u043d\u0430\u044f \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u044c, \u043d\u043e \u0438 \u0434\u0436\u0438\u0442\u0442\u0435\u0440.\n  <\/p>\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u0414\u043b\u044f \u0432\u044b\u0441\u043e\u043a\u043e\u043d\u0430\u0433\u0440\u0443\u0436\u0435\u043d\u043d\u044b\u0445 \u043a\u043b\u0430\u0441\u0442\u0435\u0440\u043e\u0432 \u043e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u0440\u0435\u043a\u043e\u043c\u0435\u043d\u0434\u0443\u0435\u0442\u0441\u044f \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c 100GbE \u0441 \u0441\u043e\u0432\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u043c\u0438 \u0430\u0434\u0430\u043f\u0442\u0435\u0440\u0430\u043c\u0438 \u0438 ToR\u2011\u043a\u043e\u043c\u043c\u0443\u0442\u0430\u0442\u043e\u0440\u0430\u043c\u0438, \u043a\u043e\u0440\u043e\u0442\u043a\u0438\u0435 DAC\u2011\u043a\u0430\u0431\u0435\u043b\u0438 \u0434\u043e 2 \u043c\u0435\u0442\u0440\u043e\u0432 \u0438 \u0432\u043a\u043b\u044e\u0447\u0435\u043d\u043d\u0443\u044e \u043f\u043e\u0434\u0434\u0435\u0440\u0436\u043a\u0443 \u043c\u0435\u0445\u0430\u043d\u0438\u0437\u043c\u043e\u0432 \u0431\u043e\u0440\u044c\u0431\u044b \u0441 \u043f\u0435\u0440\u0435\u0433\u0440\u0443\u0437\u043a\u043e\u0439 \u0434\u043b\u044f \u0443\u0434\u0435\u0440\u0436\u0430\u043d\u0438\u044f p99 &lt; 100 \u043c\u0441.\n  <\/p>\n\n  <!-- \u0411\u043b\u043e\u043a: \u043a\u043b\u0430\u0441\u0442\u0435\u0440, Kubernetes \u0438 \u043c\u043e\u043d\u0438\u0442\u043e\u0440\u0438\u043d\u0433 -->\n\n  <h2 class=\"et-section-title\">Kubernetes\u2011\u043a\u043b\u0430\u0441\u0442\u0435\u0440: \u0430\u0432\u0442\u043e\u0441\u043a\u0435\u0439\u043b\u0438\u043d\u0433 \u043f\u043e\u0434 \u0442\u0440\u0430\u0444\u0438\u043a<\/h2>\n\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u0422\u0438\u043f\u0438\u0447\u043d\u0430\u044f \u0441\u0445\u0435\u043c\u0430 \u0434\u043b\u044f \u043a\u043b\u0430\u0441\u0442\u0435\u0440\u043e\u0432 \u043e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u0441\u0442\u0440\u043e\u0438\u0442\u0441\u044f \u0432\u043e\u043a\u0440\u0443\u0433 Kubernetes: \u0444\u0440\u043e\u043d\u0442\u0435\u043d\u0434\u2011\u0431\u0430\u043b\u0430\u043d\u0441\u0438\u0440\u043e\u0432\u0449\u0438\u043a (Nginx Ingress) \u043f\u0440\u0438\u043d\u0438\u043c\u0430\u0435\u0442 HTTP\/gRPC\u2011\u0442\u0440\u0430\u0444\u0438\u043a, \u043c\u0430\u0440\u0448\u0440\u0443\u0442\u0438\u0437\u0438\u0440\u0443\u044f \u0435\u0433\u043e \u043d\u0430 \u0443\u0437\u043b\u044b \u0441 NVIDIA Triton Inference Server \u0438\u043b\u0438 \u0441\u043e\u0431\u0441\u0442\u0432\u0435\u043d\u043d\u044b\u043c\u0438 \u0441\u0435\u0440\u0432\u0438\u0441\u0430\u043c\u0438 \u043d\u0430 FastAPI\/gRPC.\n  <\/p>\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u0410\u0432\u0442\u043e\u043c\u0430\u0441\u0448\u0442\u0430\u0431\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u0435 \u0447\u0435\u0440\u0435\u0437 HPA \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u0435\u0442 \u0443\u0432\u0435\u043b\u0438\u0447\u0438\u0432\u0430\u0442\u044c \u0447\u0438\u0441\u043b\u043e Pod\u2011\u043e\u0432 \u043f\u043e \u043c\u0435\u0440\u0435 \u043f\u0440\u0438\u0431\u043b\u0438\u0436\u0435\u043d\u0438\u044f \u0441\u0440\u0435\u0434\u043d\u0435\u0433\u043e QPS \u043a 80 % \u043e\u0442 \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f, \u0430 \u0441\u0432\u044f\u0437\u043a\u0430 Prometheus + Grafana \u043e\u0431\u0435\u0441\u043f\u0435\u0447\u0438\u0432\u0430\u0435\u0442 \u043c\u043e\u043d\u0438\u0442\u043e\u0440\u0438\u043d\u0433 GPU\u2011\u0437\u0430\u0433\u0440\u0443\u0437\u043a\u0438 \u0438 p99\u2011\u0437\u0430\u0434\u0435\u0440\u0436\u043a\u0438 \u0441 \u043d\u0430\u0441\u0442\u0440\u043e\u0439\u043a\u043e\u0439 \u043e\u043f\u043e\u0432\u0435\u0449\u0435\u043d\u0438\u0439.\n  <\/p>\n\n  <h2 class=\"et-section-title\">\u041c\u043d\u043e\u0433\u043e\u0442\u0435\u043d\u0430\u043d\u0442\u043d\u043e\u0441\u0442\u044c \u0438 \u0431\u0435\u0437\u043e\u043f\u0430\u0441\u043d\u043e\u0441\u0442\u044c<\/h2>\n\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u0414\u043b\u044f \u043c\u043d\u043e\u0433\u043e\u0442\u0435\u043d\u0430\u043d\u0442\u043d\u044b\u0445 \u0441\u0446\u0435\u043d\u0430\u0440\u0438\u0435\u0432 \u0432 \u043e\u0434\u043d\u043e\u043c \u043a\u043b\u0430\u0441\u0442\u0435\u0440\u0435 \u043c\u043e\u0436\u043d\u043e \u0441\u043e\u0447\u0435\u0442\u0430\u0442\u044c \u0430\u043f\u043f\u0430\u0440\u0430\u0442\u043d\u0443\u044e \u0441\u0435\u0433\u043c\u0435\u043d\u0442\u0430\u0446\u0438\u044e GPU (MIG\/vGPU) \u0438 \u043b\u043e\u0433\u0438\u0447\u0435\u0441\u043a\u0443\u044e \u0441\u0435\u0433\u043c\u0435\u043d\u0442\u0430\u0446\u0438\u044e \u0447\u0435\u0440\u0435\u0437 Kubernetes Namespaces \u0438 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u044b\u0435 \u043d\u0430\u0431\u043e\u0440\u044b Deployment\/Service \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0430\u0440\u0435\u043d\u0434\u0430\u0442\u043e\u0440\u0430.\n  <\/p>\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u0414\u043e\u043f\u043e\u043b\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u0443\u0440\u043e\u0432\u0435\u043d\u044c \u0431\u0435\u0437\u043e\u043f\u0430\u0441\u043d\u043e\u0441\u0442\u0438 \u0434\u0430\u0435\u0442 \u0441\u0435\u0440\u0432\u0438\u0441\u043d\u0430\u044f mesh\u2011\u043e\u0431\u043e\u043b\u043e\u0447\u043a\u0430 (\u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, Istio), \u043e\u0431\u0435\u0441\u043f\u0435\u0447\u0438\u0432\u0430\u044e\u0449\u0430\u044f \u0430\u0443\u0442\u0435\u043d\u0442\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u044e, \u0448\u0438\u0444\u0440\u043e\u0432\u0430\u043d\u0438\u0435 \u0442\u0440\u0430\u0444\u0438\u043a\u0430 mTLS \u0438 \u043b\u0438\u043c\u0438\u0442\u044b \u043d\u0430 \u0443\u0440\u043e\u0432\u043d\u0435 tenant\u2011id, \u0447\u0442\u043e \u0443\u043f\u0440\u043e\u0449\u0430\u0435\u0442 \u0431\u0438\u043b\u043b\u0438\u043d\u0433 \u0438 \u043a\u043e\u043d\u0442\u0440\u043e\u043b\u044c SLA.\n  <\/p>\n\n  <!-- \u0411\u043b\u043e\u043a: \u0442\u0438\u043f\u043e\u0432\u044b\u0435 \u043a\u043e\u043d\u0444\u0438\u0433\u0443\u0440\u0430\u0446\u0438\u0438 \u0432 \u0432\u0438\u0434\u0435 \u0442\u0430\u0431\u043b\u0438\u0446\u044b (\u044f\u0434\u0440\u043e \u0441\u0442\u0430\u0442\u044c\u0438) -->\n\n  <h2 class=\"et-section-title\">\u0420\u0435\u043a\u043e\u043c\u0435\u043d\u0434\u0443\u0435\u043c\u044b\u0435 \u043a\u043e\u043d\u0444\u0438\u0433\u0443\u0440\u0430\u0446\u0438\u0438 Supermicro \u0434\u043b\u044f \u043e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430<\/h2>\n\n  <table class=\"et-table\" style=\"width:100%;border-collapse:collapse;margin-bottom:1.8rem;font-size:0.98rem;color:#111827;\">\n    <thead>\n      <tr style=\"background:linear-gradient(135deg,#2563eb,#1d4ed8);\">\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u041c\u0430\u0441\u0448\u0442\u0430\u0431 \u043c\u043e\u0434\u0435\u043b\u0438 \u0438 \u0446\u0435\u043b\u044c<\/th>\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u0420\u0435\u043a\u043e\u043c\u0435\u043d\u0434\u0443\u0435\u043c\u044b\u0439 \u0441\u0435\u0440\u0432\u0435\u0440<\/th>\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">GPU\u2011\u043a\u043e\u043d\u0444\u0438\u0433\u0443\u0440\u0430\u0446\u0438\u044f<\/th>\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">CPU \/ \u043f\u0430\u043c\u044f\u0442\u044c<\/th>\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u0421\u0435\u0442\u044c \/ \u0445\u0440\u0430\u043d\u0438\u043b\u0438\u0449\u0435<\/th>\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u041c\u043e\u0449\u043d\u043e\u0441\u0442\u044c \/ \u043e\u0440\u0438\u0435\u043d\u0442\u0438\u0440 \u0431\u044e\u0434\u0436\u0435\u0442\u0430<\/th>\n      <\/tr>\n    <\/thead>\n    <tbody>\n      <tr style=\"background:#e0edff;\">\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">&lt; 13B, 100 QPS<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">Supermicro SYS\u20111029GQ\u2011TRT (1U)<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">2\u20134\u00d7 A40 48 GB<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">Xeon 6338, \u0434\u043e 512 GB \u041e\u0417\u0423<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">2\u00d7 25GbE, \u0434\u043e 8\u00d7 NVMe<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">\u0414\u043e 1600 W, ~400\u2013600 \u0442\u044b\u0441. \u0440\u0443\u0431.<\/td>\n      <\/tr>\n      <tr style=\"background:#f1f5ff;\">\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">13\u201370B, 500 QPS<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">Supermicro SYS\u20112029GP\u2011TRT (2U)<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">4\u00d7 A6000 48 GB \u0438\u043b\u0438 A40<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">2\u00d7 EPYC 9454, \u0434\u043e 1 TB \u041e\u0417\u0423<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">2\u00d7 100GbE, \u0434\u043e 16\u00d7 NVMe<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">\u0414\u043e 2000 W, ~700\u2013900 \u0442\u044b\u0441. \u0440\u0443\u0431.<\/td>\n      <\/tr>\n      <tr style=\"background:#e0edff;\">\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">&gt; 70B, 1000+ QPS<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">Supermicro SYS\u20114029GP\u2011TRT (4U)<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">8\u00d7 H100 PCIe, pipeline parallel<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">2\u00d7 Xeon 8592+, \u0434\u043e 2 TB \u041e\u0417\u0423<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">4\u00d7 100GbE, \u0434\u043e 24\u00d7 NVMe<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">\u0414\u043e 3000 W (\u0436\u0438\u0434\u043a\u043e\u0441\u0442\u043d\u043e\u0435 \u043e\u0445\u043b\u0430\u0436\u0434\u0435\u043d\u0438\u0435), ~1,2\u20131,6 \u043c\u043b\u043d \u0440\u0443\u0431.<\/td>\n      <\/tr>\n    <\/tbody>\n  <\/table>\n\n  <!-- CTA #1 \u043f\u043e\u0441\u043b\u0435 \u043a\u043e\u043d\u0444\u0438\u0433\u0443\u0440\u0430\u0446\u0438\u043e\u043d\u043d\u043e\u0439 \u0442\u0430\u0431\u043b\u0438\u0446\u044b -->\n\n  <a href=\"https:\/\/forms.office.com\/Pages\/ResponsePage.aspx?id=M8ndOvkOi0KL2njX59S3t6RlyhCRrIdMr4Nk6XVA-x9UMk9JV0M5VDU2VkcyRlE2MlBQSVdJOFMzUy4u\" class=\"et-cta\" target=\"_blank\" rel=\"nofollow noopener\" style=\"display:inline-block;margin:2rem 0;padding:0.9rem 2.3rem;border-radius:999px;background:linear-gradient(135deg,#3b82f6,#1d4ed8);color:#ffffff;text-decoration:none;font-weight:600;box-shadow:0 10px 25px rgba(37,99,235,0.35);\">\n     \u041f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u0440\u0430\u0441\u0447\u0435\u0442 QPS \u0438 \u043a\u043e\u043d\u0444\u0438\u0433\u0443\u0440\u0430\u0446\u0438\u0438 Supermicro \u043f\u043e\u0434 \u0432\u0430\u0448 \u0441\u0435\u0440\u0432\u0438\u0441\n  <\/a>\n\n  <!-- \u0411\u043b\u043e\u043a: \u0442\u0438\u043f\u0438\u0447\u043d\u044b\u0435 \u043e\u0448\u0438\u0431\u043a\u0438 \u0438 TCO -->\n\n  <h2 class=\"et-section-title\">\u0422\u0438\u043f\u0438\u0447\u043d\u044b\u0435 \u043e\u0448\u0438\u0431\u043a\u0438 \u0438 \u0432\u043b\u0438\u044f\u043d\u0438\u0435 \u043d\u0430 TCO<\/h2>\n\n  <ul class=\"et-list\" style=\"margin:1.2rem 0 1.5rem 1.5rem;padding:0;\">\n    <li class=\"et-list-item\" style=\"margin-bottom:0.6rem;color:#374151;font-size:1.05rem;\">\n      \u041e\u0448\u0438\u0431\u043a\u0430 1: \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u00ab\u0442\u0440\u0435\u043d\u0438\u0440\u043e\u0432\u043e\u0447\u043d\u044b\u0435\u00bb 4U\u2011\u0441\u0435\u0440\u0432\u0435\u0440\u044b \u0441 \u0432\u044b\u0441\u043e\u043a\u0438\u043c\u0438 TDP \u0438 \u0436\u0438\u0434\u043a\u043e\u0441\u0442\u043d\u044b\u043c \u043e\u0445\u043b\u0430\u0436\u0434\u0435\u043d\u0438\u0435\u043c \u0434\u043b\u044f \u0447\u0438\u0441\u0442\u043e\u0433\u043e \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430, \u043f\u043e\u043b\u0443\u0447\u0430\u044f \u043b\u0438\u0448\u043d\u0438\u0435 2\u20133\u00d7 \u043f\u043e \u044d\u043d\u0435\u0440\u0433\u043e\u043f\u043e\u0442\u0440\u0435\u0431\u043b\u0435\u043d\u0438\u044e \u043f\u0440\u0438 \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u043e\u043c QPS.\n    <\/li>\n    <li class=\"et-list-item\" style=\"margin-bottom:0.6rem;color:#374151;font-size:1.05rem;\">\n      \u041e\u0448\u0438\u0431\u043a\u0430 2: \u0437\u0430\u043f\u0443\u0441\u043a\u0430\u0442\u044c \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441 \u0431\u0435\u0437 TensorRT\/ONNX\u2011\u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0446\u0438\u0438, \u043e\u0441\u0442\u0430\u0432\u043b\u044f\u044f PyTorch \u0432 \u0440\u0435\u0436\u0438\u043c\u0435 \u0440\u0430\u0437\u0440\u0430\u0431\u043e\u0442\u043a\u0438 \u0438 \u0443\u0432\u0435\u043b\u0438\u0447\u0438\u0432\u0430\u044f \u0437\u0430\u0434\u0435\u0440\u0436\u043a\u0443 \u0432 3\u20134 \u0440\u0430\u0437\u0430 \u0431\u0435\u0437 \u0432\u044b\u0438\u0433\u0440\u044b\u0448\u0430 \u0432 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435.\n    <\/li>\n    <li class=\"et-list-item\" style=\"margin-bottom:0.6rem;color:#374151;font-size:1.05rem;\">\n      \u041e\u0448\u0438\u0431\u043a\u0430 3: \u043e\u0433\u0440\u0430\u043d\u0438\u0447\u0438\u0432\u0430\u0442\u044c\u0441\u044f 25GbE \u043f\u0440\u0438 \u043a\u043b\u0430\u0441\u0442\u0435\u0440\u0435 1000+ QPS, \u043f\u043e\u043b\u0443\u0447\u0430\u044f \u043f\u0435\u0440\u0438\u043e\u0434\u0438\u0447\u0435\u0441\u043a\u0438\u0435 \u0432\u0441\u043f\u043b\u0435\u0441\u043a\u0438 \u0437\u0430\u0434\u0435\u0440\u0436\u043a\u0438 \u0438 \u043f\u043e\u0442\u0435\u0440\u0438 \u043f\u0430\u043a\u0435\u0442\u043e\u0432 \u0432\u043c\u0435\u0441\u0442\u043e \u0441\u0442\u0430\u0431\u0438\u043b\u044c\u043d\u043e\u0433\u043e p99.\n    <\/li>\n  <\/ul>\n\n  <h2 class=\"et-section-title\">3\u2011\u043b\u0435\u0442\u043d\u0438\u0439 TCO \u043a\u043b\u0430\u0441\u0442\u0435\u0440\u0430 1U\u2011\u0443\u0437\u043b\u043e\u0432<\/h2>\n\n  <table class=\"et-table\" style=\"width:100%;border-collapse:collapse;margin-bottom:1.8rem;font-size:0.98rem;color:#111827;\">\n    <thead>\n      <tr style=\"background:linear-gradient(135deg,#2563eb,#1d4ed8);\">\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u0421\u0442\u0430\u0442\u044c\u044f \u0437\u0430\u0442\u0440\u0430\u0442<\/th>\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u0421\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u044c (\u0443\u0441\u043b\u043e\u0432\u043d\u043e, \u0442\u044b\u0441. \u0440\u0443\u0431.)<\/th>\n        <th style=\"border-bottom:1px solid #1d4ed8;padding:0.55rem 0.6rem;color:#ffffff;\">\u0414\u043e\u043b\u044f \u0432 3\u2011\u043b\u0435\u0442\u043d\u0435\u043c TCO<\/th>\n      <\/tr>\n    <\/thead>\n    <tbody>\n      <tr style=\"background:#e0edff;\">\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">\u0417\u0430\u043a\u0443\u043f\u043a\u0430 8\u00d7 1U\u2011\u0443\u0437\u043b\u043e\u0432<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">4000<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">75 %<\/td>\n      <\/tr>\n      <tr style=\"background:#f1f5ff;\">\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">\u042d\u043b\u0435\u043a\u0442\u0440\u043e\u044d\u043d\u0435\u0440\u0433\u0438\u044f \u0438 \u043e\u0445\u043b\u0430\u0436\u0434\u0435\u043d\u0438\u0435<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">500<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">9 %<\/td>\n      <\/tr>\n      <tr style=\"background:#e0edff;\">\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">\u041f\u043e\u0434\u0434\u0435\u0440\u0436\u043a\u0430 \u0438 \u044d\u043a\u0441\u043f\u043b\u0443\u0430\u0442\u0430\u0446\u0438\u044f<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">300<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">6 %<\/td>\n      <\/tr>\n      <tr style=\"background:#f1f5ff;\">\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">\u0418\u0442\u043e\u0433\u043e \u0437\u0430 3 \u0433\u043e\u0434\u0430<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">4800<\/td>\n        <td style=\"border-bottom:1px solid #cbd5f5;padding:0.55rem 0.6rem;\">100 %<\/td>\n      <\/tr>\n    <\/tbody>\n  <\/table>\n\n  <p class=\"et-text\" style=\"line-height:1.8;margin-bottom:1.5rem;color:#374151;font-size:1.05rem;\">\n    \u0414\u043b\u044f \u043e\u0446\u0435\u043d\u043a\u0438 \u043e\u043a\u0443\u043f\u0430\u0435\u043c\u043e\u0441\u0442\u0438 \u043c\u043e\u0436\u043d\u043e \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u043f\u0440\u043e\u0441\u0442\u043e\u0435 \u043f\u0440\u0430\u0432\u0438\u043b\u043e: <span class=\"et-highlight\" style=\"background:#fef3c7;color:#92400e;padding:0.12rem 0.4rem;border-radius:4px;font-weight:600;\">ROI = \u043f\u0440\u0438\u0440\u043e\u0441\u0442 QPS \u00d7 ARPU \/ 3\u2011\u043b\u0435\u0442\u043d\u0438\u0439 TCO<\/span>; \u0446\u0435\u043b\u0435\u0432\u044b\u043c \u0443\u0440\u043e\u0432\u043d\u0435\u043c \u0434\u043b\u044f \u0432\u044b\u0441\u043e\u043a\u043e\u043d\u0430\u0433\u0440\u0443\u0436\u0435\u043d\u043d\u044b\u0445 LLM\u2011\u0441\u0435\u0440\u0432\u0438\u0441\u043e\u0432 \u043c\u043e\u0436\u043d\u043e \u0441\u0447\u0438\u0442\u0430\u0442\u044c ROI &gt; 2 \u0438 \u0441\u0440\u043e\u043a \u043e\u043a\u0443\u043f\u0430\u0435\u043c\u043e\u0441\u0442\u0438 &lt; 8 \u043c\u0435\u0441\u044f\u0446\u0435\u0432.\n  <\/p>\n\n  <!-- FAQ \u0431\u043b\u043e\u043a -->\n\n  <h2 class=\"et-section-title\">FAQ: \u043e\u0442\u0432\u0435\u0442\u044b \u043d\u0430 \u0447\u0430\u0441\u0442\u044b\u0435 \u0432\u043e\u043f\u0440\u043e\u0441\u044b \u043f\u043e \u043e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0443<\/h2>\n\n  <section class=\"et-faq\" style=\"margin-top:1.5rem;padding:2.0rem;border-radius:16px;background:#e5f0ff;\">\n\n    <div class=\"et-faq-list\" style=\"display:flex;flex-direction:column;gap:1rem;\">\n\n      <div class=\"et-faq-item\" style=\"background:#e0edff;border-radius:12px;padding:1.2rem 1.5rem;border:1px solid #cbd5f5;\">\n        <div class=\"et-faq-question\" style=\"font-weight:600;margin-bottom:0.4rem;font-size:1.08rem;color:#111827;\">\n          \u0414\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u043e \u043b\u0438 4\u00d7 A40 \u0434\u043b\u044f Llama\u201170B \u043f\u0440\u0438 500 QPS?\n        <\/div>\n        <div class=\"et-faq-answer\" style=\"color:#4b5563;line-height:1.7;font-size:1.02rem;\">\n          \u041f\u0440\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0438 TensorRT \u0438 INT8\u2011\u043a\u0432\u0430\u043d\u0442\u043e\u0432\u0430\u043d\u0438\u044f \u043e\u0434\u0438\u043d \u0441\u0435\u0440\u0432\u0435\u0440 \u0441 4\u00d7 A40 \u0441\u043f\u043e\u0441\u043e\u0431\u0435\u043d \u043e\u0431\u0435\u0441\u043f\u0435\u0447\u0438\u0442\u044c \u0441\u043e\u0442\u043d\u0438 QPS \u0441 \u0437\u0430\u0434\u0435\u0440\u0436\u043a\u043e\u0439 p99 &lt; 40 \u043c\u0441 \u043f\u0440\u0438 batch \u0434\u043e 64, \u043d\u043e \u0434\u043b\u044f \u0443\u0441\u0442\u043e\u0439\u0447\u0438\u0432\u044b\u0445 500 QPS \u0438 \u0437\u0430\u043f\u0430\u0441\u0430 \u043f\u043e\u0434 \u043f\u0438\u043a\u0438 \u0440\u0430\u0437\u0443\u043c\u043d\u0435\u0435 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0438\u0442\u044c \u043d\u0430\u0433\u0440\u0443\u0437\u043a\u0443 \u043d\u0430 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0442\u0430\u043a\u0438\u0445 \u0443\u0437\u043b\u043e\u0432.\n        <\/div>\n      <\/div>\n\n      <div class=\"et-faq-item\" style=\"background:#f1f5ff;border-radius:12px;padding:1.2rem 1.5rem;border:1px solid #cbd5f5;\">\n        <div class=\"et-faq-question\" style=\"font-weight:600;margin-bottom:0.4rem;font-size:1.08rem;color:#111827;\">\n          \u0427\u0442\u043e \u0432\u044b\u0431\u0440\u0430\u0442\u044c \u0434\u043b\u044f \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430: H100 \u0438\u043b\u0438 A40\/A6000?\n        <\/div>\n        <div class=\"et-faq-answer\" style=\"color:#4b5563;line-height:1.7;font-size:1.02rem;\">\n          H100 \u0432\u044b\u0438\u0433\u0440\u044b\u0432\u0430\u0435\u0442 \u043d\u0430 \u043a\u0440\u0430\u0439\u043d\u0435 \u043a\u0440\u0443\u043f\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u044f\u0445 \u0438 \u043f\u0440\u0438 \u0442\u044f\u0436\u0435\u043b\u044b\u0445 \u0432\u044b\u0447\u0438\u0441\u043b\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0445 \u0433\u0440\u0430\u0444\u0430\u0445, \u043d\u043e \u043f\u043e \u043f\u043e\u043a\u0430\u0437\u0430\u0442\u0435\u043b\u044e QPS\/\u0440\u0443\u0431\u043b\u044c \u0438 QPS\/\u0412\u0442 \u0434\u043b\u044f \u0431\u043e\u043b\u044c\u0448\u0438\u043d\u0441\u0442\u0432\u0430 LLM\u2011\u0441\u0435\u0440\u0432\u0438\u0441\u043e\u0432 A40\/A6000 \u043e\u043a\u0430\u0437\u044b\u0432\u0430\u044e\u0442\u0441\u044f \u0431\u043e\u043b\u0435\u0435 \u0432\u044b\u0433\u043e\u0434\u043d\u044b\u043c\u0438, \u043e\u0441\u043e\u0431\u0435\u043d\u043d\u043e \u043f\u0440\u0438 \u043e\u0433\u0440\u0430\u043d\u0438\u0447\u0435\u043d\u043d\u043e\u043c \u0431\u044e\u0434\u0436\u0435\u0442\u0435 \u0438 \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e\u0441\u0442\u0438 \u0431\u044b\u0441\u0442\u0440\u043e \u043c\u0430\u0441\u0448\u0442\u0430\u0431\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u043f\u0430\u0440\u043a \u0441\u0435\u0440\u0432\u0435\u0440\u043e\u0432.\n        <\/div>\n      <\/div>\n\n      <div class=\"et-faq-item\" style=\"background:#e0edff;border-radius:12px;padding:1.2rem 1.5rem;border:1px solid #cbd5f5;\">\n        <div class=\"et-faq-question\" style=\"font-weight:600;margin-bottom:0.4rem;font-size:1.08rem;color:#111827;\">\n          \u041c\u043e\u0436\u043d\u043e \u043b\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c RTX 4090 \u0432\u043c\u0435\u0441\u0442\u043e A40 \u0432 \u043f\u0440\u043e\u0434\u0430\u043a\u0448\u0435\u043d\u0435?\n        <\/div>\n        <div class=\"et-faq-answer\" style=\"color:#4b5563;line-height:1.7;font-size:1.02rem;\">\n          RTX 4090 \u0441\u043e\u0432\u043c\u0435\u0441\u0442\u0438\u043c\u0430 \u0441 CUDA \u0438 \u043c\u043e\u0436\u0435\u0442 \u0434\u0430\u0442\u044c \u0441\u043e\u043f\u043e\u0441\u0442\u0430\u0432\u0438\u043c\u0443\u044e \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0441\u0442\u044c \u0432 \u043f\u0438\u043b\u043e\u0442\u043d\u044b\u0445 \u043f\u0440\u043e\u0435\u043a\u0442\u0430\u0445, \u043d\u043e \u043e\u0442\u0441\u0443\u0442\u0441\u0442\u0432\u0438\u0435 ECC\u2011\u043f\u0430\u043c\u044f\u0442\u0438 \u0438 \u0431\u043e\u043b\u0435\u0435 \u0447\u0443\u0432\u0441\u0442\u0432\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u043a \u0434\u0440\u0430\u0439\u0432\u0435\u0440\u0430\u043c \u043f\u043e\u0442\u0440\u0435\u0431\u0438\u0442\u0435\u043b\u044c\u0441\u043a\u0438\u0439 \u0441\u0442\u0435\u043a \u0434\u0435\u043b\u0430\u044e\u0442 \u0435\u0451 \u043c\u0435\u043d\u0435\u0435 \u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u0443\u0435\u043c\u043e\u0439 \u0434\u043b\u044f \u043a\u0440\u0438\u0442\u0438\u0447\u043d\u044b\u0445 \u0431\u0438\u0437\u043d\u0435\u0441\u2011\u0441\u0435\u0440\u0432\u0438\u0441\u043e\u0432, \u043f\u043e\u044d\u0442\u043e\u043c\u0443 \u043f\u0435\u0440\u0435\u0434 \u043f\u0440\u043e\u0434\u0430\u043a\u0448\u0435\u043d\u043e\u043c \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u0430 \u0434\u043b\u0438\u0442\u0435\u043b\u044c\u043d\u0430\u044f POC\u2011\u043f\u0440\u043e\u0432\u0435\u0440\u043a\u0430.\n        <\/div>\n      <\/div>\n\n      <div class=\"et-faq-item\" style=\"background:#f1f5ff;border-radius:12px;padding:1.2rem 1.5rem;border:1px solid #cbd5f5;\">\n        <div class=\"et-faq-question\" style=\"font-weight:600;margin-bottom:0.4rem;font-size:1.08rem;color:#111827;\">\n          \u041a\u0430\u043a \u043e\u0431\u0435\u0441\u043f\u0435\u0447\u0438\u0442\u044c \u0438\u0437\u043e\u043b\u044f\u0446\u0438\u044e \u043c\u0435\u0436\u0434\u0443 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u043c\u0438 \u043c\u043e\u0434\u0435\u043b\u044f\u043c\u0438 \u0438 \u0430\u0440\u0435\u043d\u0434\u0430\u0442\u043e\u0440\u0430\u043c\u0438?\n        <\/div>\n        <div class=\"et-faq-answer\" style=\"color:#4b5563;line-height:1.7;font-size:1.02rem;\">\n          \u0410\u043f\u043f\u0430\u0440\u0430\u0442\u043d\u0430\u044f \u0441\u0435\u0433\u043c\u0435\u043d\u0442\u0430\u0446\u0438\u044f GPU \u0447\u0435\u0440\u0435\u0437 MIG\/vGPU \u0445\u043e\u0440\u043e\u0448\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u0434\u043b\u044f \u0437\u0430\u0434\u0430\u0447 \u0441 \u0433\u0430\u0440\u0430\u043d\u0442\u0438\u0440\u043e\u0432\u0430\u043d\u043d\u044b\u043c\u0438 \u043a\u0432\u043e\u0442\u0430\u043c\u0438, \u0430 \u0432 \u0441\u0432\u044f\u0437\u043a\u0435 \u0441 Kubernetes Namespaces \u0438 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u044b\u043c\u0438 Deployment \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 \u043c\u043e\u0436\u043d\u043e \u0434\u043e\u0431\u0438\u0442\u044c\u0441\u044f \u0441\u0442\u0440\u043e\u0433\u043e\u0439 \u0438\u0437\u043e\u043b\u044f\u0446\u0438\u0438 \u043f\u043e \u0440\u0435\u0441\u0443\u0440\u0441\u0430\u043c, \u043c\u0435\u0442\u0440\u0438\u043a\u0430\u043c \u0438 \u0441\u0435\u0442\u0435\u0432\u044b\u043c \u043f\u043e\u043b\u0438\u0442\u0438\u043a\u0430\u043c \u0431\u0435\u0437 \u043f\u043e\u0442\u0435\u0440\u0438 \u0443\u043f\u0440\u0430\u0432\u043b\u044f\u0435\u043c\u043e\u0441\u0442\u0438.\n        <\/div>\n      <\/div>\n\n      <div class=\"et-faq-item\" style=\"background:#e0edff;border-radius:12px;padding:1.2rem 1.5rem;border:1px solid #cbd5f5;\">\n        <div class=\"et-faq-question\" style=\"font-weight:600;margin-bottom:0.4rem;font-size:1.08rem;color:#111827;\">\n          \u041a\u0430\u043a\u0438\u0435 \u0446\u0435\u043b\u0435\u0432\u044b\u0435 \u043c\u0435\u0442\u0440\u0438\u043a\u0438 \u043c\u043e\u043d\u0438\u0442\u043e\u0440\u0438\u043d\u0433\u0430 \u0441\u0447\u0438\u0442\u0430\u0442\u044c \u00ab\u0437\u0434\u043e\u0440\u043e\u0432\u044b\u043c\u0438\u00bb \u0434\u043b\u044f \u043a\u043b\u0430\u0441\u0442\u0435\u0440\u0430 \u043e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430?\n        <\/div>\n        <div class=\"et-faq-answer\" style=\"color:#4b5563;line-height:1.7;font-size:1.02rem;\">\n          \u0414\u043b\u044f \u0437\u0440\u0435\u043b\u043e\u0433\u043e LLM\u2011\u0441\u0435\u0440\u0432\u0438\u0441\u0430 \u0441\u043b\u0435\u0434\u0443\u0435\u0442 \u043e\u0440\u0438\u0435\u043d\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c\u0441\u044f \u043d\u0430 \u0437\u0430\u0433\u0440\u0443\u0437\u043a\u0443 GPU 80\u201390 % \u0431\u0435\u0437 \u0443\u0441\u0442\u043e\u0439\u0447\u0438\u0432\u043e\u0433\u043e \u0432\u044b\u0445\u043e\u0434\u0430 \u0432 100 %, p99 \u0437\u0430\u0434\u0435\u0440\u0436\u043a\u0438 \u043d\u0435 \u0432\u044b\u0448\u0435 2\u20133\u00d7 p50, \u043e\u0442\u0441\u0443\u0442\u0441\u0442\u0432\u0438\u0435 \u0441\u0438\u0441\u0442\u0435\u043c\u0430\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u0445 \u043e\u0448\u0438\u0431\u043e\u043a OOM \u0438 \u043d\u0438\u0437\u043a\u0438\u0439 \u0443\u0440\u043e\u0432\u0435\u043d\u044c \u043f\u043e\u0442\u0435\u0440\u044c \u043f\u0430\u043a\u0435\u0442\u043e\u0432 \u043d\u0430 \u0441\u0435\u0442\u0435\u0432\u044b\u0445 \u0438\u043d\u0442\u0435\u0440\u0444\u0435\u0439\u0441\u0430\u0445 \u0434\u0430\u0436\u0435 \u0432 \u0447\u0430\u0441\u044b \u043f\u0438\u043a\u043e\u0432.\n        <\/div>\n      <\/div>\n\n    <\/div>\n  <\/section>\n\n  <!-- \u0417\u0430\u043a\u043b\u044e\u0447\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0439 CTA -->\n\n  <a href=\"https:\/\/forms.office.com\/Pages\/ResponsePage.aspx?id=M8ndOvkOi0KL2njX59S3t6RlyhCRrIdMr4Nk6XVA-x9UMk9JV0M5VDU2VkcyRlE2MlBQSVdJOFMzUy4u\" class=\"et-cta\" target=\"_blank\" rel=\"nofollow noopener\" style=\"display:inline-block;margin:2rem 0;padding:0.9rem 2.3rem;border-radius:999px;background:linear-gradient(135deg,#3b82f6,#1d4ed8);color:#ffffff;text-decoration:none;font-weight:600;box-shadow:0 10px 25px rgba(37,99,235,0.35);\">\n     \u0417\u0430\u043f\u0440\u043e\u0441\u0438\u0442\u044c \u043f\u0440\u043e\u0435\u043a\u0442 \u043a\u043b\u0430\u0441\u0442\u0435\u0440\u0430 \u043e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u043d\u0430 \u0431\u0430\u0437\u0435 Supermicro \u0432 \u0443\u0441\u043b\u043e\u0432\u0438\u044f\u0445 \u0441\u0430\u043d\u043a\u0446\u0438\u0439\n  <\/a>\n\n<\/article>","protected":false},"excerpt":{"rendered":"<p>\u041e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441 \u0431\u0435\u0437 \u0443\u0437\u043a\u0438\u0445 \u043c\u0435\u0441\u0442: \u043a\u0430\u043a \u0432\u044b\u0431\u0440\u0430\u0442\u044c Supermicro GPU\u2011\u0441\u0435\u0440\u0432\u0435\u0440 \u0434\u043b\u044f \u043d\u0438\u0437\u043a\u043e\u0439 \u0437\u0430\u0434\u0435\u0440\u0436\u043a\u0438 \u0438 \u0432\u044b\u0441\u043e\u043a\u043e\u0439 QPS \u0414\u043b\u044f \u0440\u043e\u0441\u0441\u0438\u0439\u0441\u043a\u0438\u0445 \u043a\u043e\u043c\u043f\u0430\u043d\u0438\u0439, \u0432\u043d\u0435\u0434\u0440\u044f\u044e\u0449\u0438\u0445 LLM\u2011\u0441\u0435\u0440\u0432\u0438\u0441\u044b, \u043e\u043d\u043b\u0430\u0439\u043d\u2011\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441 \u0441\u0442\u0430\u043d\u043e\u0432\u0438\u0442\u0441\u044f \u043a\u0440\u0438\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u043c \u043a\u043e\u043c\u043f\u043e\u043d\u0435\u043d\u0442\u043e\u043c: \u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u0435\u043b\u044e \u043d\u0435 \u0432\u0430\u0436\u043d\u043e, \u043a\u0430\u043a \u0434\u043e\u043b\u0433\u043e \u043e\u0431\u0443\u0447\u0430\u043b\u0430\u0441\u044c \u043c\u043e\u0434\u0435\u043b\u044c, \u043d\u043e \u043b\u044e\u0431\u0430\u044f \u0437\u0430\u0434\u0435\u0440\u0436\u043a\u0430 \u043e\u0442\u0432\u0435\u0442\u0430 \u0431\u043e\u043b\u0435\u0435 200\u2013300 \u043c\u0441 \u043d\u0430\u043f\u0440\u044f\u043c\u0443\u044e \u0431\u044c\u0435\u0442 \u043f\u043e \u043a\u043e\u043d\u0432\u0435\u0440\u0441\u0438\u0438 \u0438 \u0443\u0434\u043e\u0432\u043b\u0435\u0442\u0432\u043e\u0440\u0435\u043d\u043d\u043e\u0441\u0442\u0438. \u0412 \u043e\u0442\u043b\u0438\u0447\u0438\u0435 \u043e\u0442 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f, \u0433\u0434\u0435 \u0432\u0430\u0436\u0435\u043d \u0441\u0443\u043c\u043c\u0430\u0440\u043d\u044b\u0439 \u043e\u0431\u044a\u0451\u043c \u0432\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u0438\u0439 \u0437\u0430 \u043d\u0435\u0434\u0435\u043b\u0438 \u0438\u043b\u0438&#8230;<\/p>","protected":false},"author":6,"featured_media":16815,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[199],"tags":[250,437,427,431,436,438,435],"class_list":["post-16814","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-articles","tag-alt-linux","tag-llama-","tag-proxmox","tag-supermicro-gpu","tag-tensorrt-","tag---gpu","tag-435"],"jetpack_featured_media_url":"https:\/\/www.elishtech.com\/wp-content\/uploads\/2025\/12\/elishtech-46.jpg","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/www.elishtech.com\/en\/wp-json\/wp\/v2\/posts\/16814","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.elishtech.com\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.elishtech.com\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.elishtech.com\/en\/wp-json\/wp\/v2\/users\/6"}],"replies":[{"embeddable":true,"href":"https:\/\/www.elishtech.com\/en\/wp-json\/wp\/v2\/comments?post=16814"}],"version-history":[{"count":1,"href":"https:\/\/www.elishtech.com\/en\/wp-json\/wp\/v2\/posts\/16814\/revisions"}],"predecessor-version":[{"id":16816,"href":"https:\/\/www.elishtech.com\/en\/wp-json\/wp\/v2\/posts\/16814\/revisions\/16816"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.elishtech.com\/en\/wp-json\/wp\/v2\/media\/16815"}],"wp:attachment":[{"href":"https:\/\/www.elishtech.com\/en\/wp-json\/wp\/v2\/media?parent=16814"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.elishtech.com\/en\/wp-json\/wp\/v2\/categories?post=16814"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.elishtech.com\/en\/wp-json\/wp\/v2\/tags?post=16814"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}