Что такое субагенты в Claude Code и зачем они нужны бизнесу
Представьте: вы наняли умного сотрудника, дали ему задачу, а он вместо работы занимается перекладыванием бумажек и ждёт ваших указаний на каждый шаг. Именно так работает обычный AI-агент без субагентов — мощный инструмент, который тонет в собственном контексте и требует постоянного микроменеджмента.
Субагенты в Claude Code меняют эту картину кардинально. Это механизм, при котором один AI-агент самостоятельно создаёт и делегирует задачи другим агентам — каждый работает в своём изолированном контексте, не мешая основному процессу. Результат: параллельная работа, экономия токенов и качественно более сложные задачи, которые AI может решить без участия человека.
В этом руководстве — всё, что нужно знать предпринимателю об архитектуре субагентов: как она работает, какие проблемы решает и как внедрить её в свои бизнес-процессы.
Почему обычный AI-агент перестаёт справляться
Проблема контекстного окна
Любой AI-агент работает в рамках так называемого контекстного окна — ограниченного объёма информации, который модель удерживает одновременно. Когда агент выполняет длинную задачу, каждый промежуточный шаг (поиск, чтение файлов, анализ данных) добавляется в этот контекст. Очень быстро контекст переполняется.
И вот парадокс: даже у моделей с миллионом токенов контекста качество работы резко падает при его заполнении. Это фундаментальная архитектурная проблема — не баг конкретной версии, а особенность трансформерных моделей. Агент хуже удерживает информацию из середины контекста, начинает «забывать» детали, допускает ошибки.
Проблема «умного исполнителя»
Когда разработчик пишет код, ему сложно одновременно быть и тестировщиком — он слишком погружён в детали реализации. Агент страдает от той же проблемы. Если один агент и пишет код, и его проверяет, и следит за архитектурой — он теряет объективность. Субагенты с разными ролями и разным контекстом создают здоровое «внутреннее противоречие», которое повышает качество результата.
Проблема микроменеджмента
Без субагентов человек превращается в «самый тупой инструмент в арсенале агента» — буквально перекладывает файлы, открывает новые чаты, копирует результаты из одного окна в другое. Это не автоматизация, это ручная работа с умным помощником.
Как работают субагенты: архитектура изнутри
Subtask vs Subagent: в чём разница
Важно разграничить два термина, которые часто смешивают:
Subtask (подзадача) — запуск задачи в отдельном, чистом контексте. Никаких следов предыдущей работы. Агент получает только то, что нужно для конкретной задачи, выполняет её и возвращает результат. Системные инструкции, разрешения и набор инструментов наследуются от родительского агента автоматически.
Subagent (субагент) — запуск задачи в отдельном контексте с конкретным, заранее настроенным агентом. Вы сами определяете: какую модель использовать, какие инструменты разрешить, какие действия запретить, какой системный промт применить. Это полноценный специализированный «сотрудник» со своими правилами работы.
Разница принципиальная: subtask — это просто изоляция контекста, subagent — это ещё и специализация роли.
Инструмент Task под капотом
В Claude Code и подобных агентных системах субагенты реализованы через специальный инструмент — Task. Когда основной агент вызывает его, происходит следующее:
- Создаётся новый, полностью изолированный контекст
- В него передаётся только промт с задачей (без истории основной сессии)
- Субагент выполняет задачу, используя свои инструменты
- Результат (и только результат) возвращается в основной контекст
Весь «мусор» промежуточных шагов — прочитанные файлы, поисковые запросы, черновые выводы — остаётся изолированным и не засоряет основной рабочий контекст. Основной агент видит только чистый итог.
Параллельная работа субагентов
Один из ключевых бонусов архитектуры — параллельность. Основной агент может одновременно запустить нескольких субагентов для разных частей задачи. Пока один ищет информацию через GitHub CLI, другой параллельно обходит веб-источники. Время выполнения сокращается в разы — ровно так, как это происходит в реальных командах, где задача делится между несколькими исполнителями.
Скилы: как динамически управлять промтами и инструментами
Что такое скил
Скил (skill) — это промт, который подгружается в контекст агента только тогда, когда он нужен. Представьте библиотеку инструкций: агент видит краткое описание каждого скила, и когда задача совпадает с описанием — загружает полный промт и использует его.
Это решает сразу две проблемы, которые раньше пытались решить через субагентов:
- Динамические промты: не нужно держать все инструкции в постоянном контексте — они подгружаются по требованию
- Тяжёлые MCP-инструменты: вместо того чтобы держать в контексте гигантскую схему GitHub MCP (которая съедает десятки тысяч токенов), можно написать компактный скил с инструкцией «вот как использовать команду
ghиз терминала» — и агент загрузит его только когда понадобится GitHub
Комбинация скилов и subtask
Наиболее мощная и при этом простая архитектура выглядит так:
- Основной агент понимает, что нужен исследовательский блок
- Создаёт subtask (новый изолированный контекст)
- Внутри subtask загружает нужный скил (например, «deep research»)
- Субагент работает с полными инструкциями, но в изолированном пространстве
- Результат возвращается основному агенту
Это позволяет обойтись без создания полноценных папок агентов с кастомными конфигурациями в большинстве случаев.
Когда всё-таки нужны полноценные субагенты
Создавать отдельного субагента (с файлом конфигурации, моделью и permissions) стоит только в двух случаях:
1. Кастомные разрешения. Например, исследовательский агент, которому запрещено изменять файлы — только читать и искать. Или QA-агент, которому можно открывать браузер и проходить пользовательские сценарии, но нельзя редактировать код.
2. Выбор модели. Специализированный агент для работы с конфиденциальными данными, который использует локальную модель вместо облачной — данные не покидают контур компании.
Практические сценарии для бизнеса
Сценарий 1: Автоматизированный QA
Основной агент пишет код и по завершении запускает QA-субагента. Тот открывает браузер (через Playwright CLI), проходит заданные пользовательские сценарии из MD-файлов, фиксирует что работает, что нет. Результат возвращается основному агенту — он видит список проблем, исправляет и снова вызывает QA. Цикл повторяется до одобрения.
Ключевое: QA-агент не может менять код. Только тестировать. Это предотвращает ситуацию, когда агент «исправляет» тесты под код вместо того, чтобы исправлять код под требования.
Сценарий 2: Приватный агент для конфиденциальных данных
Есть данные, которые нельзя отправлять в облако — финансовые отчёты, договоры, персональные данные клиентов. Создаётся отдельный субагент на локальной модели (например, через Ollama). Основной агент делегирует ему работу с чувствительными файлами. Вся обработка остаётся на локальной машине. В основной контекст возвращается только структурированный результат.
Сценарий 3: Оркестратор и исполнители
Архитектура, максимально близкая к реальной команде. Основной агент-менеджер не имеет доступа к коду вообще — только к папке с задачами и документацией. Его единственная функция — правильно сформулировать задачу и передать исполнителю. Агент-разработчик получает задачи и пишет код, но не может менять документацию и постановку задач. Агент-тестировщик проверяет результат и не может редактировать рабочий код.
Это создаёт систему сдержек, при которой ни один агент не может «схитрить» — переписать тесты вместо кода или изменить требования под свои возможности.
Сценарий 4: Параллельный ресёрч
Нужно собрать информацию из нескольких независимых источников? Запускаем параллельных субагентов: один обходит GitHub-репозитории через CLI, второй ищет через веб, третий анализирует внутреннюю документацию. Время сбора сокращается кратно, контекст основного агента остаётся чистым — он получает только финальный дайджест.
Ralf Vigum Loop: агент, который не останавливается до результата
Одна из больших проблем AI-агентов — они любят «сглаживать углы». Попросили написать 10 тестов — написали 2, отрапортовали «всё готово». Этот паттерн особенно характерен для Claude-моделей с их склонностью к аккуратным завершениям.
Решение — так называемый Ralf Vigum Loop. Принцип прост: агент запускается в цикле и работает до тех пор, пока в файле с задачей не появится строка COMPLETED. Алгоритм:
- Формируем подробный план задачи в MD-файле с чётким definition of done
- Запускаем агента с инструкцией: «работай по этому файлу, закончишь — поставь COMPLETED в конец»
- Цикл запускает агента снова, если COMPLETED не появился
- Агент буквально не может «закончить» работу, не выполнив все пункты
Это убирает ручной микроменеджмент. Вместо того чтобы периодически заглядывать в чат и спрашивать «ты точно всё сделал?», вы просто ждёте финального сигнала.
Важная деталь: для работы этого подхода нужна заранее подготовленная инфраструктура — линтеры, юнит-тесты, end-to-end тесты. Агент должен иметь возможность объективно убедиться, что результат соответствует требованиям, а не просто решить «кажется, я сделал достаточно».
Роли в мультиагентной системе: не переусложняйте
Исследование команды Cursor показало неочевидный вывод: для эффективной мультиагентной системы достаточно трёх ролей, а не целого «зоопарка специалистов».
Менеджер (Planner) — изучает кодовую базу, формулирует задачи, проверяет результаты. Не пишет код сам. Его единственный инструмент — правильная постановка задачи.
Исполнитель (Worker) — получает задачу и делает. Не думает об архитектуре, не переосмысляет требования. Просто реализует.
Тестировщик/Ревьюер (Reviewer) — проверяет результат без доступа к деталям реализации. Именно изоляция контекста делает его ревью объективным.
Фронтендеры, бэкендеры, архитекторы, девопсы в агентной системе — излишняя сложность, которая создаёт накладные расходы без пропорциональной пользы.
Почему ревью — главный bottleneck в 2025-2026 году
Парадокс эпохи AI-агентов: код генерируется всё быстрее, а главным ограничением становится качество его проверки. Если ревью не успевает за генерацией — в кодовой базе накапливаются противоречия, поломанные инварианты, технический долг. Добавление новой функциональности начинает ломать существующую.
Ускорить ревью можно двумя способами. Первый — использовать специализированные инструменты (Codex CLI сейчас показывает лучшие результаты в автоматическом ревью). Второй — не доверять автоматическому ревью полностью.
У опытного разработчика есть кое-что, чего нет у агента: неявный контекст. Почему три года назад приняли именно такое архитектурное решение. Какой клиент требовал именно такое поведение. Какой баг уже был в этом месте и как его исправляли. Этот контекст не зашит в код — он живёт в головах людей. И именно он делает человеческое ревью незаменимым даже при наличии мощных AI-инструментов.
Пошаговый план внедрения для предпринимателя
Шаг 1: Начните с простого (Claude.md / agents.md)
Не нужно сразу строить сложную мультиагентную архитектуру. Начните с одного агента и заполняйте файл инструкций по мере работы. Фиксируйте, где он ошибается, какие паттерны повторяются, где нужны дополнительные правила. Это ваш будущий фундамент.
Шаг 2: Выносите повторяющиеся блоки в скилы
Заметили, что агент регулярно выполняет одну и ту же последовательность из трёх действий? Сделайте скрипт для этих трёх действий и скил с инструкцией, как его запускать. Агент получит готовый инструмент вместо того, чтобы изобретать велосипед каждый раз.
Шаг 3: Научитесь делегировать через subtask
Начните вручную просить агента создавать отдельные контексты для тяжёлых задач: «Создай отдельный контекст, выполни этот исследовательский блок, верни только результат». Отработайте паттерн делегирования, найдите свои успешные формулы.
Шаг 4: Автоматизируйте делегирование
Когда паттерны понятны — пропишите правила в инструкциях агента: в каких ситуациях он должен самостоятельно создавать subtask, какие скилы загружать. Теперь он делает это без вашего участия.
Шаг 5: Создавайте специализированных субагентов (только если нужно)
Дошли до задач, где нужны кастомные разрешения или выбор модели? Только тогда создавайте полноценных субагентов с конфигурационными файлами. Не раньше.
Часто задаваемые вопросы
Субагенты — это дорого? Токены расходуются быстрее?
Не обязательно. Да, параллельный запуск нескольких агентов увеличивает общее потребление токенов. Но субагенты одновременно экономят токены за счёт изоляции контекста: промежуточные шаги не загромождают основной контекст, не требуют компактизации, не ухудшают качество работы главного агента. На практике архитектура с субагентами часто оказывается эффективнее по соотношению «стоимость/результат», чем один агент с раздутым контекстом.
Чем субагенты отличаются от простого запуска нескольких чатов?
При ручном управлении несколькими чатами человек становится «связующим звеном» — перекладывает результаты из одного окна в другое, держит контекст в голове, следит за синхронизацией. Субагенты автоматизируют эту координацию: основной агент сам решает, когда и что делегировать, сам получает результаты и сам продолжает работу.
Мультиагентные системы, где агенты общаются друг с другом на одном уровне — это уже реально?
Технически — да, хайп — огромный. На практике — пока ненадёжно. Архитектура типа «дерево» (агент общается только со своим родительским агентом) работает стабильно. Перекрёстные взаимодействия между агентами на одном уровне — пока экспериментальная территория с непредсказуемым поведением.
Работает ли двухуровневая вложенность субагентов?
Да, и это самый продвинутый рабочий сценарий. Основной агент создаёт субагента-исследователя, тот в свою очередь делит задачу между несколькими параллельными субагентами. Особенно хорошо работает для задач типа read-only — параллельный сбор информации из независимых источников не создаёт конфликтов.
Какие скилы стоит добавить в первую очередь?
По опыту практиков: скил для браузерного тестирования (Playwright CLI), скил для работы с памятью/контекстом проекта (как обновлять и искать информацию в MD-файлах проекта), скил для глубокого исследования (deep research через веб и репозитории). Также крайне полезен скил «как правильно делегировать задачи субагентам» — агенты по умолчанию делают это неэффективно.
Итог: к чему это ведёт
Архитектура субагентов — это не технологический хайп, а логичное продолжение того, как работают эффективные команды. Разделение ролей, изоляция контекста, параллельная работа, правильное делегирование — всё это давно работает в человеческих организациях. AI-агенты просто воспроизводят эти паттерны в цифровой среде.
Главный сдвиг, который происходит прямо сейчас: время автономной работы агента растёт с каждым месяцем. Год назад агент мог уверенно работать 10-15 минут. Сегодня — полтора часа по заранее подготовленному плану. Завтра — больше. И тот, кто освоит навык правильной постановки задач, выстраивания инфраструктуры и делегирования, получит непропорциональное преимущество.
Предприниматель в этой системе перестаёт быть «оператором инструмента» и становится тем, кем и должен быть — стратегом, который формулирует задачи, задаёт definition of done и проверяет результат. Всё остальное — делегируется.