Блог о разработке

Статьи о программировании, технологиях и анализе данных

Инженеры Stripe запустили Minions — автономные агенты, генерирующие тысячи pull-requests в неделю
Инженеры Stripe разработали Minions — автономные coding-агенты, способные выполнять задачи разработки ПО от начала до конца по одной инструкции. Система связывает большие языковые модели (LLM) с...
Автор: bintocher|20 марта 2026
[AINews] Каждый серьёзный лаб, который заботится о разработчиках, скупает devtools-компании
Сегодняшняя новость о покупке Astral компанией OpenAI замыкает круг. Google DeepMind начал его, купив будущую команду Antigravity в июле прошлого года. Затем последовала покупка Bun компанией...
Автор: bintocher|20 марта 2026
Голосовые агенты на устройстве с ExecuTorch: кроссплатформенный фундамент для обработки аудио
Open-source голосовые модели появляются одна за другой, но нет единой нативной платформы для инференса (выполнения моделей) голосовых задач. К таким задачам относятся транскрипция, стриминг в...
Автор: bintocher|20 марта 2026
Google Colab получил open-source MCP-сервер: как управлять GPU-рантаймами из любого локального AI-агента
Google выпустила Colab MCP Server — сервер на базе открытого протокола Model Context Protocol (MCP). Он позволяет AI-агентам напрямую взаимодействовать с окружением Google Colab. Агенты получают...
Автор: bintocher|20 марта 2026
Google AI Studio научился vibe code'ить real-time multiplayer-игры
Google запустил новую функцию vibe coding в Google AI Studio. Она позволяет как разработчикам, так и людям без навыков программирования превращать описания на естественном языке в рабочие приложения....
Автор: bintocher|20 марта 2026
Представляем LangSmith Fleet
Мы запускаем LangSmith Fleet — корпоративное рабочее пространство для создания, использования и управления парком ваших агентов. У этих агентов есть собственная память, доступ к набору инструментов и...
Автор: bintocher|20 марта 2026
Что изменилось в Replit Agent 4 по сравнению с Agent 3
Agent 4 существенно развивает четыре направления рабочего процесса: дизайн, совместную работу, диапазон создаваемых артефактов (элементов проекта — сайтов, приложений, презентаций) и подход к...
Автор: bintocher|20 марта 2026
LlamaIndex выпускает LiteParse: CLI и нативная TypeScript-библиотека для пространственного парсинга PDF в AI-агентах
В текущей реальности Retrieval-Augmented Generation (RAG), главное узкое место для разработчиков — уже не сама большая языковая модель (LLM), а пайплайн загрузки данных. Конвертация сложных...
Автор: bintocher|20 марта 2026
MiniMax 2.7: SOTA среди открытых моделей за треть цены GLM-5
Прошло меньше двух месяцев с IPO MiniMax и публикации первых финансовых результатов. Компания снова в заголовках — на этот раз с MiniMax 2.7. Яркая новость на фоне перетасовки в линейке Qwen. По...
Автор: bintocher|20 марта 2026
Composer 2 от Cursor обходит Opus 4.6 на бенчмарках по коду — и стоит в разы дешевле
Cursor выпустил Composer 2 — третье поколение собственной модели для написания кода. На ключевых бенчмарках она обходит Claude Opus 4.6 от Anthropic, при этом цена в разы ниже. Новая модель стоит от...
Автор: bintocher|20 марта 2026
GPT 5.4 — серьёзный шаг вперёд для Codex
Я немного опоздал с обзором этой модели, но успел подумать о том, какие оси реально важны для агентов. Традиционные бенчмарки сводят производительность модели к одной цифре — корректности. Так было...
Автор: bintocher|19 марта 2026
ReasoningBank: как заставить AI-агентов эволюционировать через память о рассуждениях
LLM-агенты всё чаще работают в постоянных реальных ролях и сталкиваются с непрерывным потоком задач. Ключевое ограничение: агенты не умеют учиться на накопленном опыте. Они вынуждены отбрасывать...
Автор: bintocher|19 марта 2026
AI-учёный через масштабирование синтетических задач
Зиян Цай — Принстонский университет Харкират Бехл — Microsoft Research С появлением AI-агентов автоматические научные открытия стали реальной целью. Многие недавние работы строят агентные системы для...
Автор: bintocher|19 марта 2026
Адверсариальные атаки на современные vision-language модели
Мы исследуем адверсариальную устойчивость open-source vision-language моделей (VLM — модели для совместной работы с изображениями и текстом), развёрнутых в изолированной e-commerce среде. Среда...
Автор: bintocher|19 марта 2026
VisBrowse-Bench: бенчмарк для оценки визуально-ориентированного поиска в мультимодальных browsing-агентах
Развитие мультимодальных больших языковых моделей (MLLM) позволило browsing-агентам находить и анализировать мультимодальную информацию из реального веба. Но существующие бенчмарки имеют два...
Автор: bintocher|19 марта 2026
BiomedSQL: Text-to-SQL для научного рассуждения над биомедицинскими базами знаний
Биомедицинские исследователи всё чаще используют крупные структурированные базы данных для сложной аналитики. Но современные системы text-to-SQL (перевод текста в SQL-запросы) плохо справляются с...
Автор: bintocher|19 марта 2026
В Meta не справляются с выходящими из-под контроля AI-агентами
Image Credits: Carol Yepes / Getty Images AI-агент в Meta вышел из-под контроля и открыл доступ к конфиденциальным данным компании и пользователей для сотрудников, не имевших на это прав. Как следует...
Автор: bintocher|19 марта 2026
Google Labs превратил Stitch в полноценную AI-платформу для дизайна интерфейсов
Google Labs развернул инструмент Stitch в полноценную платформу для проектирования ПО на базе ИИ. Инструмент генерирует пользовательские интерфейсы по текстовым описаниям на естественном языке. Этот...
Автор: bintocher|19 марта 2026
Аспиранты, ставшие судьями ИИ-индустрии
Модели искусственного интеллекта размножаются стремительно, а конкуренция накаляется. При таком количестве игроков на рынке какая модель окажется лучшей — и кто это решает? Arena (ранее LM Arena)...
Автор: bintocher|18 марта 2026
Polly теперь доступна на всех страницах LangSmith
Отладка AI-агентов отличается от обычной. Трейсы (логи выполнения) уходят на сотни шагов вглубь. Промпты содержат тысячи строк. Когда что-то ломается, причина ошибки теряется посередине. Polly — это...
Автор: bintocher|18 марта 2026