Code With Claude 2026: агенты, воркфлоу, метрики

6 мая в Сан-Франциско прошла конференция Code with Claude 2026. Anthropic выложила записи стримов на YouTube. Доклады охватили разработку на Claude Code, платформе для разработчиков и партнёрских интеграциях с GitHub, Vercel, Datadog, Bun и несколькими AI-native стартапами. Сквозная тема дня — как ступенчатые улучшения моделей меняют продуктовую архитектуру, устройство команд и экономику инфраструктуры.

Диксон Цай из команды Claude Code показал свежие обновления. В части developer experience появился удалённый контроль: сессия запускается на одной машине и продолжается на телефоне. Переработанный десктопный GUI получил split view, возможность закреплять сообщения ассистента как главы с автогенерированным оглавлением и инлайн-комментарии к диффам. На стороне автономности auto mode передаёт решения о разрешениях классификатору. Тот фильтрует деструктивные действия и prompt injection (внедрение вредоносных инструкций через пользовательский ввод). А worktrees (изолированные рабочие копии репозитория) дают Claude возможность самостоятельно создавать изолированные ветки. Цай также продемонстрировал routines — промпты, которые запускаются по cron-расписанию, GitHub-вебхукам или API-эндпоинтам.

За ним вышел Mario Rodriguez, CPO GitHub, с совместным докладом с Брэдом Абрамсом из Anthropic. Rodriguez определил cache hit rate (долю запросов, обслуженных из кэша) как фундаментальную метрику для любой команды, отправляющей миллиарды сообщений на платформу. «Это похоже на высокочастотный трейдинг — всего 1% эффективности означают миллионы в масштабах». GitHub целится в cache hit rate выше 94%, а просадка до 70% обычно сигнализирует о баге в сборке промптов. Rodriguez перечислил три причины инвалидации кэша, с которыми GitHub пришлось инженерно справляться.

Абрамс воспользовался выступлением, чтобы представить advisor strategy. Суть подхода: небольшая модель-исполнитель вроде Haiku обращается к более крупной модели-советнику вроде Opus только на сложных случаях. «Мы получаем интеллект, близкий к уровню Opus, за значительно меньшие деньги, потому что очень консервативно подходим к токенам, которые советник реально отправляет». Rodriguez дополнил это критиком с внутренним именем Rubber Duck. Он запускается после планирования, после сложной реализации и после написания тестов, но до их запуска.

Продакт-менеджер Claude Managed Agents Джесс Ян и инженер Anthropic Лэнс Мартин вокруг обеда показали демо Claude Managed Agents. Их тезис: инфраструктура, а не интеллект — теперь узкое место для production-агентов. Они разобрали примитивы для sandboxed-выполнения кода, чекпоинтинга и ограничения области доступа credential’ов.

В час дня на главную сцену вышли сооснователь и CEO Dario Amodei и сооснователь и президент Daniela Amodei. Daniela сказала, что «разработчики — важнейшие пользователи Claude». Она описала внутреннее культурное значение hold light and shade — принцип, который регулирует, как Anthropic выпускает мощные модели вместе с защитными ограничителями. Dario сообщил, что выручка и использование за Q1 2026 в годовом выражении выросли в 80 раз — не в 10, как планировалось. Именно это, по его словам, стало причиной недавнего давления на вычислительные мощности. Частично проблему решает объявленное в тот же день партнёрство со SpaceX.

Он повторил своё предыдущее предсказание: в 2026 году появится одна человеко-компания с миллиардным оборотом. При этом две человеко-компании, построенные на AI, уже перешагнули миллиарддолларовую оценку. Следующий перелом, по его словам, — команды агентов, работающие на уровне организаций, а не отдельных людей. А тормозят процессы те части software engineering, которые нельзя верифицировать автоматически: качество дизайна и security review. Именно на обучение моделей этому Anthropic сейчас фокусируется.

Руководитель Claude Code Борис Черни и создатель Bun Джарред Самнер в живой сессии кодинга показали, как Bun поддерживает себя с помощью бота Robobun. Тот воспроизводит каждую проблему и открывает pull request только когда сгенерированный регрессионный тест падает на предыдущей версии Bun и проходит на ветке с исправлением. VP по инженерингу Datadog Сеш Налла представил концепцию machine tool: агенты должны выдавать «точные спецификации интента и проблемной области», а не придумывать разрозненные инструменты под каждый локальный запрос.

Затем CEO Vercel Гильермо Раух сел с Анжелой Цзян, руководителем платформенных продуктов Anthropic. Rauch сообщил, что токены Opus составляют чуть больше 20% использования Vercel AI Gateway, но больше 70% расходов. При этом траты кредитов на V0 удвоились после последнего апгрейда Anthropic. Умные модели позволили Vercel упростить харнес (набор вспомогательных компонентов для работы с моделью). Улучшенный вкус модели означал, что V0 может усвоить десятилетие дизайнерских суждений Vercel вместо того, чтобы с ними бороться. Поверхность инструментов сжалась — модели пишут промежуточный код в песочницах вместо опоры на предопределённых sub-agent’ов. «Теперь мы больше инженерим вокруг одобрений инструментов — вокруг создания правильных защитных ограничителей», — сказал Раух.

Панель, модератором которой выступила Бет Робертсон, руководитель стартап-партнёрств Anthropic, собрала сооснователя Cognition Уолдена Яна, руководителя AI-продукта Gamma Дини Фатиху и руководителя прикладных исследований Harvey Нико Группена. Тема обсуждения — продуктовая архитектура в условиях экспоненциального прогресса моделей. Cognition делает Devin — автономного кодингового агента, работающего на собственном компьютере. Gamma — AI-native инструмент для презентаций и документов с более чем 70 миллионами пользователей. Harvey — генеративная AI-платформа для юридических и профессиональных сервисов. Каждый панелист рассказал, как приходилось переписывать продукт из-за инфлекции возможностей модели (резкого скачка в способностях).

Брэд Абрамс вернулся позже для отдельной сессии по Claude Platform — про prompt caching, structured outputs и паттерны проектирования инструментов, наблюдаемые у клиентов с большими нагрузками. День закрыл глава developer relations Anthropic Алекс Альберт. Он сообщил, что Claude прошёл путь от 62% на SWE-bench Verified с Sonnet 3.7 год назад до 87% с Opus 4.7. Альберт использовал фреймворк кривой возможностей, чтобы задать ожидания от года впереди.

Записи всех сессий доступны на YouTube-канале Anthropic. Следующие мероприятия: Лондон 19 мая и Токио 10 июня.