Claude Opus 4.6 и Sonnet 4.6: 1M токенов контекста

Claude Opus 4.6 и Sonnet 4.6 теперь поддерживают полное окно контекста в 1M токенов на Claude Platform по стандартному прайсингу. Ставка одинакова на всём диапазоне: $5/$25 за миллион токенов для Opus 4.6 и $3/$15 для Sonnet 4.6. Никаких наценок за длинный контекст — запрос на 900K токенов оплачивается по той же цене за токен, что и на 9K.

Что даёт стабильный релиз (general availability):

Единая цена на всё окно контекста. Никакой наценки за длинный контекст.
Полные лимиты запросов (rate limits) на любой длине контекста. Стандартная пропускная способность (throughput) аккаунта работает на всём диапазоне.
Медиа — в 6 раз больше. До 600 изображений или PDF-страниц вместо 100. Доступно сегодня на Claude Platform, Microsoft Foundry и Google Cloud Vertex AI.
Больше не нужен beta-заголовок. Запросы свыше 200K токенов обрабатываются автоматически. Если вы уже отправляете beta-заголовок, он игнорируется — менять код не нужно.

В Claude Code окно в 1M токенов теперь включено для пользователей Max, Team и Enterprise при работе с Opus 4.6. Сессии с Opus 4.6 автоматически используют полный контекст. Это означает меньше компакций (автоматических сжатий истории диалога) и больше сохранённого контекста разговора. Ранее 1M контекст требовал дополнительного включения.

Контекст, который не подводит

Миллион токенов контекста имеет смысл только если модель может извлекать нужные детали и рассуждать на их основе. Opus 4.6 набирает 78.3% на MRCR v2 — лучший результат среди frontier-моделей (самых продвинутых моделей текущего поколения) при такой длине контекста.

Claude Opus 4.6 и Sonnet 4.6 сохраняют точность на всём окне в 1M токенов. Качество извлечения из длинного контекста улучшается с каждым поколением моделей.

Это значит, что можно загрузить всю кодовую базу, тысячи страниц договоров или полный трейс (лог шагов) долгоживущего агента. В трейс входят вызовы инструментов, наблюдения и промежуточные рассуждения — работать с ними можно напрямую. Инженерные обходные пути, lossy-суммаризация (сжатие с потерей данных) и очистка контекста больше не нужны. Весь разговор остаётся целым.

Claude Code мог сжигать 100K+ токенов, ища что-то в Datadog, Braintrust, базах данных и исходном коде. Потом включалась компакция. Детали терялись. Приходилось отлаживать по кругу. С 1M контекстом я ищу, ищу заново, агрегирую edge cases (крайние случаи) и предлагаю фикс — всё в одном окне.

Антон Бирюков, Software Engineer

До появления 1M контекста у Opus 4.6 нам приходилось сжимать контекст, как только пользователи загружали большие PDF-файлы, датасеты или изображения. Из-за этого мы теряли точность как раз на тех задачах, которые были важнее всего. Мы увидели снижение числа компакций на 15%. Теперь наши агенты удерживают всё и работают часами, не забывая, что прочитали на первой странице.

Джон Белл, CPO

Opus 4.6 с окном в 1M токенов сделал наш Devin Review агент значительно эффективнее. Большие диффы (различия в коде) не помещались в 200K контекста. Поэтому агенту приходилось дробить их на части — это вело к лишним проходам и потере cross-file (межфайловых) зависимостей. С 1M контекстом мы подаём полный дифф и получаем ревью более высокого качества через более простую и экономичную по токенам обвязку (интеграцию).

Адхьян Сексария, Founding Engineer

Eve использует 1M контекст по умолчанию, потому что самые сложные задачи адвокатов истцов этого требуют. Будь то перекрёстная проверка 400-страничной транскрипции допроса или выявление ключевых связей во всём деле — расширенное окно контекста позволяет давать ответы существенно более высокого качества.

Маурисио Вульфович, ML Engineer

Научные открытия требуют одновременного рассуждения по научной литературе, математическим фреймворкам, базам данных и коду симуляций. 1M контекст и расширенные медиа-лимиты Opus 4.6 позволяют нашим агентным системам синтезировать сотни статей, доказательств и кодовых баз за один проход. Это радикально ускоряет наши фундаментальные и прикладные исследования в физике.

Доктор Алекс Висснер-Гросс, Co-Founder

С 1M контекстом Claude внутренний юрист может загрузить пять итераций стостраничного партнёрского соглашения в одну сессию и наконец увидеть полную картину переговоров. Больше никаких переключений между версиями и потери того, что изменилось три раунда назад.

Бардиа Пурвакиль, Co-founder и CTO

Крупные production-системы содержат бездну контекста, а production-инциденты могут быть очень сложными. С окном в 1M токенов Claude мы можем держать в поле зрения каждую сущность, сигнал и рабочую гипотезу — от первого алерта до ремедиации (устранения неполадок). Это работает без необходимости постоянно сжимать контекст или жертвовать нюансами.

Майанк Агравал, Founder & CTO

Мы расширили окно контекста Opus с 200K до 500K, и агент стал работать эффективнее — в итоге он тратит меньше токенов. Меньше накладных расходов, больше фокуса на задаче.

Иззи Миллер, AI Research Lead

Реальные задачи в электронных таблицах требуют глубокого исследования и сложных многошаговых планов. 1M контекст Claude позволяет нам сохранять приверженность задаче и внимание к деталям.

Тарун Амаса, CEO

Как начать

Окно контекста в 1M токенов доступно сегодня на Claude Platform, а также через Amazon Bedrock, Google Cloud Vertex AI и Microsoft Foundry. Пользователи Claude Code Max, Team и Enterprise, работающие с Opus 4.6, автоматически получат 1M контекст.

Подробнее — в документации и на странице с прайсингом.