Блог о разработке

Статьи о программировании, технологиях и анализе данных

Together AI расширяет сервис дообучения: поддержка tool calling, reasoning и работы с изображениями

Together AI расширяет сервис дообучения: поддержка tool calling, reasoning и работы с изображениями

При переходе от однократных запросов к сложным многошаговым workflow надёжность моделей ломается в предсказуемых местах. Tool-вызовы не соответствуют схемам. Качество reasoning (цепочек рассуждений)...

Тэги:релиз ai/ml агенты qwen

Автор: bintocher|18 марта 2026

Как инфраструктурный шум искажает оценки agentic-бенчмарков по коду

Как инфраструктурный шум искажает оценки agentic-бенчмарков по коду

Agentic-бенчмарки (тесты, где модель действует как автономный агент) по написанию кода — SWE-bench и Terminal-Bench — стали стандартом для сравнения возможностей передовых моделей. Разрыв между...

Тэги:исследование ai/ml агенты инфраструктура anthropic kubernetes

Автор: bintocher|18 марта 2026

Ваш CLAUDE.md делает агента тупее. Исследование на 138 репозиториях это доказало

Ваш CLAUDE.md делает агента тупее. Исследование на 138 репозиториях это доказало

Полгода я собирал идеальный CLAUDE.md. Вычитывал каждую строку: «используй yarn, не npm», «тесты запускай так», «структура проекта вот такая». 200 строк выстраданного контекста. Потом учёные из ETH...

Тэги:исследование мнение ai/ml агенты anthropic

Автор: bintocher|18 марта 2026

Code Review в Claude Code: многоагентная проверка каждого PR

Code Review в Claude Code: многоагентная проверка каждого PR

Claude Code получает полноценную систему code review на базе команды агентов — по модели, которую мы используем в Anthropic. Доступно в research preview — раннем доступе для тестирования. Сегодня мы...

Тэги:claude code релиз агенты devops

Автор: bintocher|18 марта 2026

Picsart запускает маркетплейс AI-агентов: теперь креаторы могут «нанять» ИИ-ассистентов

Picsart запускает маркетплейс AI-агентов: теперь креаторы могут «нанять» ИИ-ассистентов

Дизайн-платформа Picsart, построенная вокруг ИИ, запускает маркетплейс AI-агентов, где креаторы могут «нанять» ИИ-ассистентов для конкретных задач — например, для ресайза и ремикса контента для...

Тэги:picsart агенты ai/ml релиз бизнес

Автор: bintocher|18 марта 2026

Настраиваем Cowork с помощью плагинов

Настраиваем Cowork с помощью плагинов

Мы создавали Cowork, чтобы дать каждому возможность работать на полную мощность с Claude Code. Теперь мы добавили поддержку плагинов. Они позволяют объединять любые навыки, коннекторы (модули...

Тэги:релиз anthropic агенты бизнес

Автор: bintocher|18 марта 2026

Open SWE: open-source фреймворк для внутренних coding-агентов

Open SWE: open-source фреймворк для внутренних coding-агентов

За последний год несколько инженерных команд создали внутренних coding-агентов, которые работают бок о бок с разработчиками. Stripe разработал Minions, Ramp собрал Inspect, Coinbase создал Cloudbot....

Тэги:релиз агенты deep agents langchain

Автор: bintocher|18 марта 2026

Защита кодовой базы с помощью автономных агентов

Защита кодовой базы с помощью автономных агентов

За последние девять месяцев скорость создания PR у нас выросла в 5 раз. Инструменты безопасности на базе статического анализа или жёсткого распределения ответственности за код по-прежнему полезны. Но...

Тэги:cursor релиз безопасность агенты devops

Автор: bintocher|18 марта 2026

Обучение Composer работе с длинными горизонтами задач

Обучение Composer работе с длинными горизонтами задач

Мы обучаем Composer решать задачи с длинным горизонтом через reinforcement learning (обучение с подкреплением). Мы назвали этот метод self-summarization (самосжатие). Встроив самосжатие в процесс...

Тэги:cursor composer ai/ml агенты исследование

Автор: bintocher|18 марта 2026

Mistral делает ставку на «собери свой AI»: французский стартап бросает вызов OpenAI и Anthropic на корпоративном рынке

Mistral делает ставку на «собери свой AI»: французский стартап бросает вызов OpenAI и Anthropic на корпоративном рынке

Большинство корпоративных AI-проектов проваливаются не из-за нехватки технологий, а потому, что модели не понимают специфику бизнеса. Они обучены на интернет-данных, а не на многолетних внутренних...

Тэги:mistral llm релиз ai/ml бизнес агенты

Автор: bintocher|18 марта 2026

Повышаем точность и эффективность веб-поиска с динамической фильтрацией

Повышаем точность и эффективность веб-поиска с динамической фильтрацией

Вместе с Claude Opus 4.6 и Sonnet 4.6 мы выпускаем обновлённые версии инструментов web search и web fetch. Теперь Claude может напрямую писать и выполнять код во время веб-поиска — чтобы фильтровать...

Тэги:anthropic релиз ai/ml агенты

Автор: bintocher|18 марта 2026

Окно контекста в 1M токенов стало общедоступным для Opus 4.6 и Sonnet 4.6

Окно контекста в 1M токенов стало общедоступным для Opus 4.6 и Sonnet 4.6

Claude Opus 4.6 и Sonnet 4.6 теперь поддерживают полное окно контекста в 1M токенов на Claude Platform по стандартному прайсингу. Ставка одинакова на всём диапазоне: $5/$25 за миллион токенов для...

Тэги:anthropic релиз ai/ml агенты

Автор: bintocher|18 марта 2026

Осознание бенчмарка в результатах Claude Opus 4.6 на BrowseComp

Осознание бенчмарка в результатах Claude Opus 4.6 на BrowseComp

BrowseComp — бенчмарк (набор тестов), проверяющий, насколько хорошо модели находят труднообнаружимую информацию в интернете. Как и многие бенчмарки, он уязвим к загрязнению данных. Ответы утекают в...

Тэги:anthropic llm агенты исследование безопасность

Автор: bintocher|18 марта 2026

GLM-5-Turbo: новая модель Zhipu AI для агентных задач

GLM-5-Turbo: новая модель Zhipu AI для агентных задач

16 марта 2026 года компания Zhipu AI (на международном рынке — Z.ai) представила GLM-5-Turbo — языковую модель, специально оптимизированную для агентных сценариев в экосистеме OpenClaw. Контекстное...

Тэги:релиз ai/ml glm-5 zhipu ai агенты

Автор: bintocher|18 марта 2026