Утечка исходного кода Claude Code
OpenAI закрыла крупнейший в истории раунд на сумму свыше $110 млрд. ARR компании составляет $24 млрд — рост в 4 раза быстрее, чем у Google и Meta в их лучшие годы. Также OpenAI провела «мягкое IPO» с $3 млрд инвестиций и включением в ETF от ARK Invest. Но главная новость дня — утечка исходного кода Claude Code.
Кстати, у OpenAI не всё гладко. ChatGPT так и не преодолел отметку в 1 млрд WAU (еженедельных активных пользователей), запланированную на конец 2025 года. А Codex не анонсировал новых достижений за март.
Что произошло
Исходные файлы Claude Code оказались доступны через source maps, попавшие в финальную сборку. Это вызвало волну обратного инжиниринга, зеркалирования и создания производных портов. Один из форков набрал 32,6k звёзд и 44,3k форков, прежде чем юридические риски заставили автора конвертировать код в Python с помощью Codex (Yuchenj_UW). Общий объём утёкшего кода составил более 500k строк (Yuchenj_UW).
Anthropic отреагировала DMCA-уведомлениями для сдерживания распространения. На фоне утечки один из членов команды Claude Code даже анонсировал новую фичу — упрощённую настройку GitHub-credentials через /web-setup. Продукт продолжил работать как ни в чём не бывало.
Параллельно утечка создала реальную угрозу безопасности. Атакующие оперативно зарегистрировали подозрительные npm-пакеты (color-diff-napi, modifiers-napi), нацеленные на тех, кто попытается скомпилировать утёкший код (Butanium_).
Что раскрывает об архитектуре
Для Anthropic утечка неприятна, но не фатальна — в коде нет весов модели. Зато это полноценный учебник по проектированию передовых агентских фреймворков (agent harness — каркас, управляющий работой ИИ-агента). Sebastian Raschka выделил 6 ключевых решений:
- Состояние репозитория в контексте — последние коммиты и информация о git-ветке подставляются в промпт
- Агрессивное переиспользование кеша
- Собственные Grep/Glob/LSP — отраслевой стандарт, но реализованный вручную
- Дедупликация файловых чтений и сэмплирование результатов инструментов
- Структурированная сессионная память (подробнее ниже)
- Subagents (субагенты)
Интересный нюанс: по умолчанию включено менее 20 инструментов из 60+ доступных: AgentTool, BashTool, FileReadTool, FileEditTool, FileWriteTool, NotebookEditTool, WebFetchTool, WebSearchTool, TodoWriteTool, TaskStopTool, TaskOutputTool, AskUserQuestionTool, SkillTool, EnterPlanModeTool, ExitPlanModeV2Tool, SendMessageTool, BriefTool, ListMcpResourcesTool, ReadMcpResourceTool.

Система памяти — трёхслойная архитектура
Память Claude Code состоит из трёх слоёв:
- MEMORY.md — индекс, указывающий на другие файлы знаний
- Тематические файлы — загружаются по запросу по мере необходимости
- Полные транскрипты сессий — доступны для поиска
Отдельно выделяется режим autoDream — «сон», в котором система объединяет воспоминания, дедуплицирует их, очищает от лишнего и удаляет противоречия.

Глубокий разбор от mem0 выделяет 8 фаз работы с памятью:

А также 5 видов Compaction — механизмов сжатия контекста по мере роста сессии:

Fork-join для subagents через KV cache
Ключевая фишка Claude Code — использование KV cache для создания fork-join модели субагентов. KV cache — кеш промежуточных вычислений модели, позволяющий не пересчитывать предыдущие токены заново. Fork-join — паттерн, при котором задача распараллеливается (fork), а результаты собираются обратно (join). Каждый субагент наследует полный контекст основного и не тратит токены на повторную передачу. Итог: параллелизм практически бесплатен.



Нереализованные фичи и внутренние инструменты
Утечка вскрыла внутренний gate для сотрудников и внутренний TUI — текстовый интерфейс в терминале для работы с продуктом. Также обнаружилась масса функций в разработке, включая ULTRAPLAN и KAIROS.
Попались и внутренние MAGIC DOCS:

Забавные находки
Среди менее значимых, но забавных открытий — полный список глаголов, кодовое имя Capybara/Mythos v8, первоапрельская фича /buddy, подтверждённый WTF-счётчик Бориса, проклятый Claude Codex и ещё дюжина нереализованных фич.
Тем, кто хочет покопаться самостоятельно, — можно просмотреть множество хостед-форков исходного кода.
