Блог о разработке
Статьи о программировании, технологиях и анализе данных

Инженеры Stripe разработали Minions — автономные coding-агенты, способные выполнять задачи разработки ПО от начала до конца по одной инструкции. Система связывает большие языковые модели (LLM) с...
Автор: bintocher|20 марта 2026
![[AINews] Каждый серьёзный лаб, который заботится о разработчиках, скупает devtools-компании](/_next/image?url=https%3A%2F%2Fs3.cloud.ru%2Fchernovdev%2Fuploads%2Fae9b75874eef1d757e29d0cf710c6579.jpg%3FX-Amz-Algorithm%3DAWS4-HMAC-SHA256%26X-Amz-Content-Sha256%3DUNSIGNED-PAYLOAD%26X-Amz-Credential%3Dc1a5f83b-062d-4358-a783-b3a03a547c42%253A885a616e8602af884636f9cbc6ea809a%252F20260612%252Fru-central-1%252Fs3%252Faws4_request%26X-Amz-Date%3D20260612T014318Z%26X-Amz-Expires%3D604800%26X-Amz-Signature%3Daa517b8d14059e9dff99868f8c6143b23ab823f36374fa9f6372a31d7db8d121%26X-Amz-SignedHeaders%3Dhost%26x-amz-checksum-mode%3DENABLED%26x-id%3DGetObject&w=3840&q=75)
Сегодняшняя новость о покупке Astral компанией OpenAI замыкает круг. Google DeepMind начал его, купив будущую команду Antigravity в июле прошлого года. Затем последовала покупка Bun компанией...

Open-source голосовые модели появляются одна за другой, но нет единой нативной платформы для инференса (выполнения моделей) голосовых задач. К таким задачам относятся транскрипция, стриминг в...
Автор: bintocher|20 марта 2026

Google выпустила Colab MCP Server — сервер на базе открытого протокола Model Context Protocol (MCP). Он позволяет AI-агентам напрямую взаимодействовать с окружением Google Colab. Агенты получают...
Автор: bintocher|20 марта 2026

Google запустил новую функцию vibe coding в Google AI Studio. Она позволяет как разработчикам, так и людям без навыков программирования превращать описания на естественном языке в рабочие приложения....

Мы запускаем LangSmith Fleet — корпоративное рабочее пространство для создания, использования и управления парком ваших агентов. У этих агентов есть собственная память, доступ к набору инструментов и...
Автор: bintocher|20 марта 2026

Agent 4 существенно развивает четыре направления рабочего процесса: дизайн, совместную работу, диапазон создаваемых артефактов (элементов проекта — сайтов, приложений, презентаций) и подход к...

В текущей реальности Retrieval-Augmented Generation (RAG), главное узкое место для разработчиков — уже не сама большая языковая модель (LLM), а пайплайн загрузки данных. Конвертация сложных...
Автор: bintocher|20 марта 2026

Прошло меньше двух месяцев с IPO MiniMax и публикации первых финансовых результатов. Компания снова в заголовках — на этот раз с MiniMax 2.7. Яркая новость на фоне перетасовки в линейке Qwen. По...
Автор: bintocher|20 марта 2026

Cursor выпустил Composer 2 — третье поколение собственной модели для написания кода. На ключевых бенчмарках она обходит Claude Opus 4.6 от Anthropic, при этом цена в разы ниже. Новая модель стоит от...

Я немного опоздал с обзором этой модели, но успел подумать о том, какие оси реально важны для агентов. Традиционные бенчмарки сводят производительность модели к одной цифре — корректности. Так было...
Автор: bintocher|19 марта 2026

LLM-агенты всё чаще работают в постоянных реальных ролях и сталкиваются с непрерывным потоком задач. Ключевое ограничение: агенты не умеют учиться на накопленном опыте. Они вынуждены отбрасывать...
Автор: bintocher|19 марта 2026

Зиян Цай — Принстонский университет Харкират Бехл — Microsoft Research С появлением AI-агентов автоматические научные открытия стали реальной целью. Многие недавние работы строят агентные системы для...
Автор: bintocher|19 марта 2026

Мы исследуем адверсариальную устойчивость open-source vision-language моделей (VLM — модели для совместной работы с изображениями и текстом), развёрнутых в изолированной e-commerce среде. Среда...
Автор: bintocher|19 марта 2026

Развитие мультимодальных больших языковых моделей (MLLM) позволило browsing-агентам находить и анализировать мультимодальную информацию из реального веба. Но существующие бенчмарки имеют два...
Автор: bintocher|19 марта 2026

Биомедицинские исследователи всё чаще используют крупные структурированные базы данных для сложной аналитики. Но современные системы text-to-SQL (перевод текста в SQL-запросы) плохо справляются с...
Автор: bintocher|19 марта 2026

Image Credits: Carol Yepes / Getty Images AI-агент в Meta вышел из-под контроля и открыл доступ к конфиденциальным данным компании и пользователей для сотрудников, не имевших на это прав. Как следует...
Автор: bintocher|19 марта 2026

Google Labs развернул инструмент Stitch в полноценную платформу для проектирования ПО на базе ИИ. Инструмент генерирует пользовательские интерфейсы по текстовым описаниям на естественном языке. Этот...

Модели искусственного интеллекта размножаются стремительно, а конкуренция накаляется. При таком количестве игроков на рынке какая модель окажется лучшей — и кто это решает? Arena (ранее LM Arena)...

Отладка AI-агентов отличается от обычной. Трейсы (логи выполнения) уходят на сотни шагов вглубь. Промпты содержат тысячи строк. Когда что-то ломается, причина ошибки теряется посередине. Polly — это...