Блог о разработке
Статьи о программировании, технологиях и анализе данных

За последний год несколько инженерных команд создали внутренних coding-агентов, которые работают бок о бок с разработчиками. Stripe разработал Minions, Ramp собрал Inspect, Coinbase создал Cloudbot....
Автор: bintocher|18 марта 2026

За последние девять месяцев скорость создания PR у нас выросла в 5 раз. Инструменты безопасности на базе статического анализа или жёсткого распределения ответственности за код по-прежнему полезны. Но...
Автор: bintocher|18 марта 2026

Мы обучаем Composer решать задачи с длинным горизонтом через reinforcement learning (обучение с подкреплением). Мы назвали этот метод self-summarization (самосжатие). Встроив самосжатие в процесс...
Автор: bintocher|18 марта 2026

Большинство корпоративных AI-проектов проваливаются не из-за нехватки технологий, а потому, что модели не понимают специфику бизнеса. Они обучены на интернет-данных, а не на многолетних внутренних...

Вместе с Claude Opus 4.6 и Sonnet 4.6 мы выпускаем обновлённые версии инструментов web search и web fetch. Теперь Claude может напрямую писать и выполнять код во время веб-поиска — чтобы фильтровать...

Claude Opus 4.6 и Sonnet 4.6 теперь поддерживают полное окно контекста в 1M токенов на Claude Platform по стандартному прайсингу. Ставка одинакова на всём диапазоне: $5/$25 за миллион токенов для...

BrowseComp — бенчмарк (набор тестов), проверяющий, насколько хорошо модели находят труднообнаружимую информацию в интернете. Как и многие бенчмарки, он уязвим к загрязнению данных. Ответы утекают в...
Автор: bintocher|18 марта 2026

16 марта 2026 года компания Zhipu AI (на международном рынке — Z.ai) представила GLM-5-Turbo — языковую модель, специально оптимизированную для агентных сценариев в экосистеме OpenClaw. Контекстное...