Блог о разработке

Статьи о программировании, технологиях и анализе данных

Open SWE: open-source фреймворк для внутренних coding-агентов
За последний год несколько инженерных команд создали внутренних coding-агентов, которые работают бок о бок с разработчиками. Stripe разработал Minions, Ramp собрал Inspect, Coinbase создал Cloudbot....
Автор: bintocher|18 марта 2026
Защита кодовой базы с помощью автономных агентов
За последние девять месяцев скорость создания PR у нас выросла в 5 раз. Инструменты безопасности на базе статического анализа или жёсткого распределения ответственности за код по-прежнему полезны. Но...
Автор: bintocher|18 марта 2026
Обучение Composer работе с длинными горизонтами задач
Мы обучаем Composer решать задачи с длинным горизонтом через reinforcement learning (обучение с подкреплением). Мы назвали этот метод self-summarization (самосжатие). Встроив самосжатие в процесс...
Автор: bintocher|18 марта 2026
Mistral делает ставку на «собери свой AI»: французский стартап бросает вызов OpenAI и Anthropic на корпоративном рынке
Большинство корпоративных AI-проектов проваливаются не из-за нехватки технологий, а потому, что модели не понимают специфику бизнеса. Они обучены на интернет-данных, а не на многолетних внутренних...
Автор: bintocher|18 марта 2026
Повышаем точность и эффективность веб-поиска с динамической фильтрацией
Вместе с Claude Opus 4.6 и Sonnet 4.6 мы выпускаем обновлённые версии инструментов web search и web fetch. Теперь Claude может напрямую писать и выполнять код во время веб-поиска — чтобы фильтровать...
Автор: bintocher|18 марта 2026
Окно контекста в 1M токенов стало общедоступным для Opus 4.6 и Sonnet 4.6
Claude Opus 4.6 и Sonnet 4.6 теперь поддерживают полное окно контекста в 1M токенов на Claude Platform по стандартному прайсингу. Ставка одинакова на всём диапазоне: $5/$25 за миллион токенов для...
Автор: bintocher|18 марта 2026
Осознание бенчмарка в результатах Claude Opus 4.6 на BrowseComp
BrowseComp — бенчмарк (набор тестов), проверяющий, насколько хорошо модели находят труднообнаружимую информацию в интернете. Как и многие бенчмарки, он уязвим к загрязнению данных. Ответы утекают в...
Автор: bintocher|18 марта 2026
GLM-5-Turbo: новая модель Zhipu AI для агентных задач
16 марта 2026 года компания Zhipu AI (на международном рынке — Z.ai) представила GLM-5-Turbo — языковую модель, специально оптимизированную для агентных сценариев в экосистеме OpenClaw. Контекстное...
Автор: bintocher|18 марта 2026