Привет, я Кузин Евгений — генеральный директор и основатель ITCost. Это мой личный блог, где мы делимся знаниями, которые накопили в работе с LLM, GPU, серверной инфраструктурой и корпоративным ИИ в России.
Здесь мы публикуем практические материалы о локальных LLM, выборе оборудования, внедрении AI-решений в корпоративную среду, анализе логов, OCR и реальных ограничениях инфраструктуры. Без лишней воды — только то, что можно применить в работе.
Разбираем серверную архитектуру для локальных LLM моделей 32B–235B: выбор GPU, памяти, серверов, кластеров и QLoRA для корпоративной инфраструктуры.
Практический разбор RTX Pro 6000 Blackwell 96 GB для локальных LLM: энергопотребление, память, выбор сервера, несколько GPU и применение в корпоративной инфраструктуре.
Разбираем, сколько видеопамяти требуют локальные LLM в 2026 году: квантование, KV-cache, реальные тесты и выбор GPU для корпоративного сегмента.