Перейти к основному содержимому

Self-hosted LLM для инженерных команд: цена, приватность, задержка

· 10 мин. чтения
Artur Pan
CTO & Co-Founder at PanDev

Финтех на 40 инженеров, с которыми я говорил в прошлом месяце, платил $960 в месяц за GitHub Copilot Business на всю команду, но их юристы только что заблокировали использование после compliance-review: телеметрия code completion уходила через облако Microsoft. CTO задал мне обманчиво простой вопрос: «Можем ли мы self-host'ить эквивалент?»

Ответ — «да, но только если пройдёте три фильтра». Stack Overflow Developer Survey 2024 показал, что 76% разработчиков используют или планируют использовать AI-инструменты, но в регулируемых индустриях adoption отстаёт на 20-30 пунктов. Разрыв — не в скепсисе, а в инфраструктуре. Большинство команд хотят приватный inference, но недооценивают, во что «self-hosted» обходится по GPU capex, времени SRE и компромиссу в качестве модели.

Это фреймворк, который мы даём командам, обдумывающим переход: когда self-hosted LLM бьёт облако, когда нет, и три точки, где математика переворачивается.

Cursor vs Windsurf vs Cody: какой AI IDE в 2026?

· 8 мин. чтения
Artur Pan
CTO & Co-Founder at PanDev

Cursor поднял $900M при оценке $9B в августе 2024. Windsurf (бывший Codeium) продан OpenAI за $3B в 2025. Sourcegraph Cody перешёл на полноценный IDE. Три AI-native IDE теперь достаточно зрелы, чтобы выбор между ними стал реальным вопросом — не "какой работает", а "какой подходит под ограничения команды по приватности, latency и глубине контекста". Stack Overflow Developer Survey 2025 показал, что 62% профессиональных разработчиков используют AI-tool ежедневно, против 44% в 2024. Тот же опрос: выбор инструмента важнее выбора редактора — удовлетворённость гуляет на ~20 пунктов в зависимости от AI-ассистента, против ~5 для самого редактора.

Это не вердикт "который лучший" — это decision framework с числами. Мы конкретизируем, где выигрывает каждый, где проигрывает, и где наши IDE heartbeat данные по командам в production (n=47 команд, ~340 разработчиков) совпадают с маркетингом или противоречат ему.

Hourly vs monthly: как считать стоимость в смешанных командах

· 8 мин. чтения
Artur Pan
CTO & Co-Founder at PanDev

Финансовый лид команды из 12 разработчиков открывает дашборд расходов. Общий burn за месяц: $58 000. Четверо в штате на месячном окладе, пятеро контракторов на почасовой ставке, ещё трое работают через вендора с месячным инвойсом. Дашборд показывает одно среднее значение стоимости разработчика. Это неверная цифра, и каждое решение по cost-per-feature, построенное на ней, тоже неверное.

Стандартное решение — конвертация 160 часов: делим месячную ставку на 160, получаем «эквивалентную часовую» и сравниваем. По данным US Bureau of Labor Statistics, средний работник реально отрабатывает 1 791 час в год. Это 149 часов в месяц, не 160. В Казахстане 24 рабочих дня отпуска плюс 13 праздничных дней дают эффективную цифру ближе к 144 часам. 160 — это наследие, которое уже не соответствует данным даже в стране-источнике.

AI-тесты: качество, покрытие, доверие (как мерить на самом деле)

· 7 мин. чтения
Artur Pan
CTO & Co-Founder at PanDev

Copilot написал 420 тестов для модуля платежей за два дня. Coverage прыгнул с 58% до 84%. Уверенность в релизе? Без изменений, а то и хуже. Исследование 2024 IEEE (An Empirical Study on the Usage of Transformer Models for Code Completion, Ciniselli et al.) показало: LLM-сгенерированные тесты компилируются в 92% случаев, но ловят лишь 58-62% инъектированных мутаций — стандартный исследовательский тест на «этот тест вообще что-то проверяет». Человеческие тесты в том же исследовании — 78%. Разрыв ~20 процентных пунктов в mutation score — реальная история качества AI-тестов, а не цифра coverage, которую все репортят.

Эта статья измеряет, в чём AI-тесты хороши, что они пропускают, и как выстроить pipeline, чтобы AI давал throughput, не разъедая уверенность в релизе.

Loaded hourly rate: почему час разработчика стоит в 1.5 раза дороже зарплаты

· 8 мин. чтения
Artur Pan
CTO & Co-Founder at PanDev

Senior backend разработчик в Алматы получает $5 000/мес. gross. CFO, который оценивает новый проект, делает очевидную арифметику: $5 000 ÷ 160 = $31.25/час. Эта цифра попадает в Excel, потом в борд-дек, потом в коммерческое предложение клиенту.

Реальная стоимость часа этого инженера, с учётом накладных расходов, ближе к $46/час. Разрыв в 48%. DORA State of DevOps Report 2024 фиксирует non-coding overhead в инженерных организациях на уровне 35–55% от ФОТ. McKinsey Developer Velocity Index (2023) даёт примерно тот же диапазон. Большинство компаний этот множитель просто не применяют. Они квотят, скоупят и бюджетируют по «голой» цифре, а потом удивляются, почему юнит-экономика не сходится.

Claude vs ChatGPT vs Copilot для кода: сравнение 2026

· 7 мин. чтения
Artur Pan
CTO & Co-Founder at PanDev

Рынок AI-инструментов для кода к началу 2026 года разделился на четырёх серьёзных игроков: GitHub Copilot, Cursor, Claude Code (CLI от Anthropic) и ChatGPT с Code Interpreter. Маркетинг у всех четырёх обещает "+40% продуктивности" — цифра одинаковая и бессмысленная без измерения. Мы подняли данные IDE heartbeat и session у 112 инженеров в 14 B2B-командах за Q1 2026, чтобы посмотреть, что реально экономит время.

Суть: пользователи Claude Code экономят 54 минуты в день; пользователи Copilot — 28. Но распределение не то, на что намекает маркетинг — лучший инструмент зависит от вида работы, а не от "AI-зрелости" команды.

AI-ревью кода: оно реально помогает? (Данные со 100 команд)

· 7 мин. чтения
Artur Pan
CTO & Co-Founder at PanDev

AI-ревью кода сидит на гребне хайп-цикла. GitHub Copilot, CodeRabbit, Qodo, Graphite и ещё полдюжины стартапов продают будущее, где LLM ловят баги быстрее людей. Классическое исследование Microsoft Research и Bacchelli 2013 года задало бейзлайн, с которым мы сравниваемся десять лет: человеческое ревью ловит ~14% функциональных дефектов, но 68% проблем maintainability. Вопрос сегодня: сдвигает ли добавление LLM хоть одну из этих цифр?

Мы вытащили данные по ревью со 100 B2B-команд между Q1 2025 и Q1 2026 — микс команд с AI-ревью, без, и с гибридом. Паттерн не такой, как рассказывают вендоры.

CEO о здоровье инженерной команды (без технического жаргона)

· 9 мин. чтения
Artur Pan
CTO & Co-Founder at PanDev

Большинство нетехнических CEO относятся к инженерии либо как к чёрному ящику, либо как к театру. CEO-чёрный-ящик спрашивает «как дела у инженерки?» на исполкоме, принимает ответ «идём по плану» и через четыре квартала удивляется, когда уходит архитектор, а роадмап встаёт. CEO-театр становится самодеятельным инженерным менеджером — учит DORA-метрики, неправильно произносит «Kubernetes» и превращает любое обсуждение roadmap в технический спор, за которым сам не успевает.

Ни то ни другое — не про интеллект. Это про отсутствие короткого нетехнического словаря для оценки здоровья инженерии. First Round State of Startups 2023 показал, что 68% CEO-первопроходцев считают себя «скорее» или «очень» зависимыми от CTO по любым инженерным решениям — это нормально, пока CTO не уходит или не расходится с советом директоров во взглядах.

Этот гайд — минимальный словарь CEO: 6 вопросов, позволяющих проверить здоровье инженерии без попытки стать техническим.

Engineering Director: как масштабировать влияние с 50 до 500

· 9 мин. чтения
Artur Pan
CTO & Co-Founder at PanDev

Engineering Director, хорошо ведший организацию на 50 человек, обычно неверный человек, чтобы вести 500. Не потому что талантлив меньше — потому что на 500 это другая работа, а не та же с удвоенной интенсивностью. Исследования First Round Review по 300+ инженерным лидерам стабильно показывают: переходы на ~80, ~150 и ~300 инженерах — там, где кластеризуется большинство выгораний и тихих уходов старших лидеров.

Это гайд, основанный на данных, о четырёх переходах Engineering Director при росте от 50 до 500 — что отпустить, что взять, и что наши IDE heartbeat данные говорят о признаках Director'а, который не сделал сдвиг.

Engineering Manager vs Tech Lead vs Engineering Lead: разница 2026

· 8 мин. чтения
Artur Pan
CTO & Co-Founder at PanDev

Вашего лучшего senior-инженера повысили в «лида». Никто не написал, TL это или EM, — и теперь она делает и то, и то. Ревьюит каждый PR, ведёт все 1:1, планирует каждый спринт и при этом должна катить свой код. Через три месяца её личный output обвалился, командный — следом. Stack Overflow Developer Survey 2024: инженеры в гибридных «lead»-ролях сообщают о в 1,6 раза более высоком выгорании, чем те, кто на чистом IC или чистом management треке. Слияние ролей — самая частая и самая дорогая ошибка в инженерном лидерстве, которую мы видим.

Tech Lead и Engineering Manager — разные работы с разными метриками успеха, разным распределением времени и разными режимами отказа. Выберите одно на человека или обе, но наймите двоих.