Блог о разработке

Статьи о программировании, технологиях и анализе данных

Инженеры Stripe запустили Minions — автономные агенты, генерирующие тысячи pull-requests в неделю

Инженеры Stripe запустили Minions — автономные агенты, генерирующие тысячи pull-requests в неделю

Инженеры Stripe разработали Minions — автономные coding-агенты, способные выполнять задачи разработки ПО от начала до конца по одной инструкции. Система связывает большие языковые модели (LLM) с...

Тэги:llm агенты ai/ml devops исследование

Автор: bintocher|20 марта 2026

[AINews] Каждый серьёзный лаб, который заботится о разработчиках, скупает devtools-компании

[AINews] Каждый серьёзный лаб, который заботится о разработчиках, скупает devtools-компании

Сегодняшняя новость о покупке Astral компанией OpenAI замыкает круг. Google DeepMind начал его, купив будущую команду Antigravity в июле прошлого года. Затем последовала покупка Bun компанией...

Тэги:обзор ai/ml openai cursor claude code агенты

Автор: bintocher|20 марта 2026

Голосовые агенты на устройстве с ExecuTorch: кроссплатформенный фундамент для обработки аудио

Голосовые агенты на устройстве с ExecuTorch: кроссплатформенный фундамент для обработки аудио

Open-source голосовые модели появляются одна за другой, но нет единой нативной платформы для инференса (выполнения моделей) голосовых задач. К таким задачам относятся транскрипция, стриминг в...

Тэги:executorch релиз edge-вычисления агенты

Автор: bintocher|20 марта 2026

Google Colab получил open-source MCP-сервер: как управлять GPU-рантаймами из любого локального AI-агента

Google Colab получил open-source MCP-сервер: как управлять GPU-рантаймами из любого локального AI-агента

Google выпустила Colab MCP Server — сервер на базе открытого протокола Model Context Protocol (MCP). Он позволяет AI-агентам напрямую взаимодействовать с окружением Google Colab. Агенты получают...

Тэги:google colab mcp релиз агенты

Автор: bintocher|20 марта 2026

Google AI Studio научился vibe code'ить real-time multiplayer-игры

Google AI Studio научился vibe code'ить real-time multiplayer-игры

Google запустил новую функцию vibe coding в Google AI Studio. Она позволяет как разработчикам, так и людям без навыков программирования превращать описания на естественном языке в рабочие приложения....

Тэги:gemini релиз frontend агенты

Автор: bintocher|20 марта 2026

Представляем LangSmith Fleet

Представляем LangSmith Fleet

Мы запускаем LangSmith Fleet — корпоративное рабочее пространство для создания, использования и управления парком ваших агентов. У этих агентов есть собственная память, доступ к набору инструментов и...

Тэги:langchain релиз агенты безопасность

Автор: bintocher|20 марта 2026

Что изменилось в Replit Agent 4 по сравнению с Agent 3

Что изменилось в Replit Agent 4 по сравнению с Agent 3

Agent 4 существенно развивает четыре направления рабочего процесса: дизайн, совместную работу, диапазон создаваемых артефактов (элементов проекта — сайтов, приложений, презентаций) и подход к...

Тэги:агенты обзор frontend

Автор: bintocher|20 марта 2026

LlamaIndex выпускает LiteParse: CLI и нативная TypeScript-библиотека для пространственного парсинга PDF в AI-агентах

LlamaIndex выпускает LiteParse: CLI и нативная TypeScript-библиотека для пространственного парсинга PDF в AI-агентах

В текущей реальности Retrieval-Augmented Generation (RAG), главное узкое место для разработчиков — уже не сама большая языковая модель (LLM), а пайплайн загрузки данных. Конвертация сложных...

Тэги:релиз ai/ml агенты rag edge-вычисления

Автор: bintocher|20 марта 2026

MiniMax 2.7: SOTA среди открытых моделей за треть цены GLM-5

MiniMax 2.7: SOTA среди открытых моделей за треть цены GLM-5

Прошло меньше двух месяцев с IPO MiniMax и публикации первых финансовых результатов. Компания снова в заголовках — на этот раз с MiniMax 2.7. Яркая новость на фоне перетасовки в линейке Qwen. По...

Тэги:minimax релиз ai/ml агенты инфраструктура

Автор: bintocher|20 марта 2026

Composer 2 от Cursor обходит Opus 4.6 на бенчмарках по коду — и стоит в разы дешевле

Composer 2 от Cursor обходит Opus 4.6 на бенчмарках по коду — и стоит в разы дешевле

Cursor выпустил Composer 2 — третье поколение собственной модели для написания кода. На ключевых бенчмарках она обходит Claude Opus 4.6 от Anthropic, при этом цена в разы ниже. Новая модель стоит от...

Тэги:cursor composer релиз ai/ml агенты

Автор: bintocher|20 марта 2026

GPT 5.4 — серьёзный шаг вперёд для Codex

GPT 5.4 — серьёзный шаг вперёд для Codex

Я немного опоздал с обзором этой модели, но успел подумать о том, какие оси реально важны для агентов. Традиционные бенчмарки сводят производительность модели к одной цифре — корректности. Так было...

Тэги:gpt-5.4 claude code агенты мнение

Автор: bintocher|19 марта 2026

ReasoningBank: как заставить AI-агентов эволюционировать через память о рассуждениях

ReasoningBank: как заставить AI-агентов эволюционировать через память о рассуждениях

LLM-агенты всё чаще работают в постоянных реальных ролях и сталкиваются с непрерывным потоком задач. Ключевое ограничение: агенты не умеют учиться на накопленном опыте. Они вынуждены отбрасывать...

Тэги:llm агенты gemini исследование ai/ml

Автор: bintocher|19 марта 2026

AI-учёный через масштабирование синтетических задач

AI-учёный через масштабирование синтетических задач

Зиян Цай — Принстонский университет Харкират Бехл — Microsoft Research С появлением AI-агентов автоматические научные открытия стали реальной целью. Многие недавние работы строят агентные системы для...

Тэги:llm qwen агенты ai/ml исследование

Автор: bintocher|19 марта 2026

Адверсариальные атаки на современные vision-language модели

Адверсариальные атаки на современные vision-language модели

Мы исследуем адверсариальную устойчивость open-source vision-language моделей (VLM — модели для совместной работы с изображениями и текстом), развёрнутых в изолированной e-commerce среде. Среда...

Тэги:qwen агенты ai/ml безопасность исследование

Автор: bintocher|19 марта 2026

VisBrowse-Bench: бенчмарк для оценки визуально-ориентированного поиска в мультимодальных browsing-агентах

VisBrowse-Bench: бенчмарк для оценки визуально-ориентированного поиска в мультимодальных browsing-агентах

Развитие мультимодальных больших языковых моделей (MLLM) позволило browsing-агентам находить и анализировать мультимодальную информацию из реального веба. Но существующие бенчмарки имеют два...

Тэги:llm агенты исследование ai/ml

Автор: bintocher|19 марта 2026

BiomedSQL: Text-to-SQL для научного рассуждения над биомедицинскими базами знаний

BiomedSQL: Text-to-SQL для научного рассуждения над биомедицинскими базами знаний

Биомедицинские исследователи всё чаще используют крупные структурированные базы данных для сложной аналитики. Но современные системы text-to-SQL (перевод текста в SQL-запросы) плохо справляются с...

Тэги:исследование ai/ml llm агенты hugging face

Автор: bintocher|19 марта 2026

В Meta не справляются с выходящими из-под контроля AI-агентами

В Meta не справляются с выходящими из-под контроля AI-агентами

Image Credits: Carol Yepes / Getty Images AI-агент в Meta вышел из-под контроля и открыл доступ к конфиденциальным данным компании и пользователей для сотрудников, не имевших на это прав. Как следует...

Тэги:openclaw агенты уязвимость безопасность

Автор: bintocher|19 марта 2026

Google Labs превратил Stitch в полноценную AI-платформу для дизайна интерфейсов

Google Labs превратил Stitch в полноценную AI-платформу для дизайна интерфейсов

Google Labs развернул инструмент Stitch в полноценную платформу для проектирования ПО на базе ИИ. Инструмент генерирует пользовательские интерфейсы по текстовым описаниям на естественном языке. Этот...

Тэги:gemini релиз frontend агенты

Автор: bintocher|19 марта 2026

Аспиранты, ставшие судьями ИИ-индустрии

Аспиранты, ставшие судьями ИИ-индустрии

Модели искусственного интеллекта размножаются стремительно, а конкуренция накаляется. При таком количестве игроков на рынке какая модель окажется лучшей — и кто это решает? Arena (ранее LM Arena)...

Тэги:llm anthropic агенты ai/ml обзор

Автор: bintocher|18 марта 2026

Polly теперь доступна на всех страницах LangSmith

Polly теперь доступна на всех страницах LangSmith

Отладка AI-агентов отличается от обычной. Трейсы (логи выполнения) уходят на сотни шагов вглубь. Промпты содержат тысячи строк. Когда что-то ломается, причина ошибки теряется посередине. Polly — это...

Тэги:langchain релиз агенты

Автор: bintocher|18 марта 2026