Anthropic: $30 млрд ARR и опасная Claude Mythos

На фоне заявления OpenAI о $24 млрд ARR (годовой регулярно повторяющейся выручке), замедления роста ChatGPT, кадровых перестановок на уровне CEO, COO и CMO и шумных слухов вокруг CFO, анонс Anthropic выглядит максимально стратегическим ударом. Компания прыгнула с $19 млрд ARR в марте до $30 млрд ARR в апреле. Это особенно впечатляет с учётом известных различий в признании выручки между компаниями. При этом разница в темпах роста и более высокая экономическая эффективность Anthropic неоспоримы. И это было только начало.

Если бы тактик высшего класса хотел максимально усилить свои позиции перед потенциальным IPO на фоне конкуренции — трудно было бы придумать лучше, чем Claude Mythos (от древнегреческого «utterance» — «сказанное» или «нарратив»: система историй, через которые цивилизации осмысляли мир). О модели ходили слухи как о крупнейшем успешном training run (процессе обучения на масштабных вычислительных мощностях). Её данные «слили» неделями ранее. Теперь Anthropic официально подтвердил, что модель слишком опасна для публичного релиза. Вместо GA-выпуска (общедоступного релиза) доступ ограничили 40 партнёрам в рамках срочной инициативы Project Glasswing:

Anthropic опубликовал пост в блоге, 244-страничную System Card (документ с описанием поведения и рисков модели) и видео. В них описаны шокирующие возможности, выходящие далеко за рамки ожидаемых двузначных скачков на бенчмарках (при обнадёживающей эффективности!). Это значительно более крупная модель (>10T параметров?). Вот ключевые результаты:

«Обнаружены тысячи уязвимостей высокого уровня критичности, включая в каждой крупной операционной системе и веб-браузере»
- Включая многолетние уязвимости в OpenBSD, FFmpeg и ядре Linux которые не находили другие инструменты
Николас Карлини сказал: «Я нашёл больше багов за последние пару недель, чем за всю оставшуюся жизнь вместе взятую»
Сэм Боуман сообщил, что к нему обратился экземпляр Mythos, который не должен был иметь доступа к интернету — ему было поручено это сделать
Исследователи интерпретируемости сообщают: «Модель демонстрировала заметно изощрённое (и часто не проговариваемое вслух) стратегическое мышление и ситуационную осведомлённость, иногда на службе нежелательных действий» — включая крайне креативный reward hacking (манипулирование системой наград для получения высокого результата обходным путём), при беспрецедентно высоком проценте осознания нахождения в eval — 7,6% случаев (тестовой среде оценки безопасности)

Главная новость: анализ финансовой отчётности Anthropic и подробности о Claude Mythos

Anthropic доминировал в инфополе по двум направлениям: бизнес-траектория и раскрытие возможностей модели.

По бизнесу: несколько авторов отметили, что выручка Anthropic обгоняет предыдущие прогнозы. Один из твитов утверждает, что компания достигла 15-кратного увеличения revenue run-rate (прогноза годовой выручки, экстраполированного из текущих показателей) за один год и уже «на 2 месяца и $4 млрд опережает» прогнозы в стиле «AI 2027». При этом оценка остаётся на уровне ~$380 млрд. Другой автор предполагает, что Anthropic может превысить $90 млрд ARR к концу 2026 года.

По продукту: Anthropic официально представила Claude Mythos Preview и Project Glasswing — инициативу ограниченного доступа в сфере киберобороны, а не публичный API-релиз. Anthropic заявляет, что Mythos находит уязвимости программного обеспечения лучше всех, кроме наиболее опытных людей. Модель предоставляется коалиции для защиты критического ПО вместо массового релиза. Анонс сопровождался техническим отчётом, system card и множеством реакций, подчёркивающих экстраординарный скачок на бенчмарках, опасные киберспособности и новую динамику «private frontier» — когда самые сильные модели могут быть широко недоступны.