Блог о разработке

Статьи о программировании, технологиях и анализе данных

Google AI Studio научился vibe code'ить real-time multiplayer-игры
Google запустил новую функцию vibe coding в Google AI Studio. Она позволяет как разработчикам, так и людям без навыков программирования превращать описания на естественном языке в рабочие приложения....
Автор: bintocher|20 марта 2026
Представляем LangSmith Fleet
Мы запускаем LangSmith Fleet — корпоративное рабочее пространство для создания, использования и управления парком ваших агентов. У этих агентов есть собственная память, доступ к набору инструментов и...
Автор: bintocher|20 марта 2026
Что изменилось в Replit Agent 4 по сравнению с Agent 3
Agent 4 существенно развивает четыре направления рабочего процесса: дизайн, совместную работу, диапазон создаваемых артефактов (элементов проекта — сайтов, приложений, презентаций) и подход к...
Автор: bintocher|20 марта 2026
Команда суперискусственного интеллекта Microsoft выпускает MAI-Image-2 — генератор изображений по тексту
Команда суперискусственного интеллекта Microsoft, возглавляемая Мустафой Сулейманом, представила MAI-Image-2. Это AI-модель, которая превращает текстовые запросы (промпты) в изображения. На данный...
Автор: bintocher|20 марта 2026
OpenAI меняет систему выбора моделей в ChatGPT
OpenAI полностью переработала интерфейс выбора моделей в ChatGPT. Вместо конкретных названий пользователи теперь видят до трёх уровней в зависимости от подписки. «Instant» — для быстрых повседневных...
Автор: bintocher|20 марта 2026
LlamaIndex выпускает LiteParse: CLI и нативная TypeScript-библиотека для пространственного парсинга PDF в AI-агентах
В текущей реальности Retrieval-Augmented Generation (RAG), главное узкое место для разработчиков — уже не сама большая языковая модель (LLM), а пайплайн загрузки данных. Конвертация сложных...
Автор: bintocher|20 марта 2026
Война с Ираном повредила несколько дата-центров AWS: удар по мифу о надёжности multi-AZ
В начале марта иранские беспилотники повредили три дата-центра AWS в ОАЭ и Бахрейне. Инцидент затронул несколько зон доступности (Availability Zones) в рамках одного региона. Это вызвало серьёзные...
Автор: 585108837|20 марта 2026
MiniMax 2.7: SOTA среди открытых моделей за треть цены GLM-5
Прошло меньше двух месяцев с IPO MiniMax и публикации первых финансовых результатов. Компания снова в заголовках — на этот раз с MiniMax 2.7. Яркая новость на фоне перетасовки в линейке Qwen. По...
Автор: bintocher|20 марта 2026
Composer 2 от Cursor обходит Opus 4.6 на бенчмарках по коду — и стоит в разы дешевле
Cursor выпустил Composer 2 — третье поколение собственной модели для написания кода. На ключевых бенчмарках она обходит Claude Opus 4.6 от Anthropic, при этом цена в разы ниже. Новая модель стоит от...
Автор: bintocher|20 марта 2026
Claude Opus 4.6 нашёл 22 уязвимости в Firefox за две недели
Claude Opus 4.6 обнаружил 22 уязвимости безопасности в Firefox всего за две недели. Четырнадцать из них получили статус высокой критичности — это почти 20% всех аналогичных багов, исправленных в...
Автор: bintocher|20 марта 2026
GPT 5.4 — серьёзный шаг вперёд для Codex
Я немного опоздал с обзором этой модели, но успел подумать о том, какие оси реально важны для агентов. Традиционные бенчмарки сводят производительность модели к одной цифре — корректности. Так было...
Автор: bintocher|19 марта 2026
Anthropic запустила ограниченную акцию, удваивающую лимиты использования для всех пользователей Claude. Акция действует с 13 по 28 марта 2026 года. Удвоенные лимиты доступны в непиковые часы: Время:...
Тэги:
Автор: bintocher|19 марта 2026
ReasoningBank: как заставить AI-агентов эволюционировать через память о рассуждениях
LLM-агенты всё чаще работают в постоянных реальных ролях и сталкиваются с непрерывным потоком задач. Ключевое ограничение: агенты не умеют учиться на накопленном опыте. Они вынуждены отбрасывать...
Автор: bintocher|19 марта 2026
Выявление скрытых стереотипов: мультиязычная оценка современных LLM через призму дебатов
Большие языковые модели (LLM) массово используются для открытого общения. Однако большинство оценок предвзятости по-прежнему опирается на англоязычные задачи классификации. Исследователи из MBZUAI,...
Автор: bintocher|19 марта 2026
Xiaomi MiMo-V2-Pro: флагманская AI-модель с триллионом параметров
Компания Xiaomi представила MiMo-V2-Pro — флагманскую foundation-модель, оптимизированную для агентских рабочих нагрузок. Модель входит в топ-8 мирового рейтинга Artificial Analysis Intelligence...
Тэги:
Автор: bintocher|19 марта 2026
AI-учёный через масштабирование синтетических задач
Зиян Цай — Принстонский университет Харкират Бехл — Microsoft Research С появлением AI-агентов автоматические научные открытия стали реальной целью. Многие недавние работы строят агентные системы для...
Автор: bintocher|19 марта 2026
Адверсариальные атаки на современные vision-language модели
Мы исследуем адверсариальную устойчивость open-source vision-language моделей (VLM — модели для совместной работы с изображениями и текстом), развёрнутых в изолированной e-commerce среде. Среда...
Автор: bintocher|19 марта 2026
Omni IIE Bench: бенчмарк для оценки реальных возможностей моделей редактирования изображений
Yujia Yang, Yuanxiang Wang, Zhenyu Guan, Tiankun Yang, Chenxi Bao, Haopeng Jin, Jinwen Luo, Xinyu Zuo, Lisheng Duan, Haijin Liang, Jin Ma, Xinming Wang, Ruiwen Tao, Hongzhu Yi — University of Chinese...
Автор: bintocher|19 марта 2026
AgriChat: мультимодальная LLM для анализа сельскохозяйственных изображений
Irfan Hussain, Sajid Javed — Департамент компьютерных наук, Университет Халифа, Абу-Даби, ОАЭ Применение Multimodal Large Language Models (MLLM) в сельском хозяйстве упирается в критический...
Автор: bintocher|19 марта 2026
Мультимодальное мультиагентное обучение с подкреплением для генерации рентгеновских отчётов: рабочий процесс, подобный работе радиолога, с клинически верифицируемыми наградами
Kaito Baba, Satoshi Kodera Department of Cardiovascular Medicine, The University of Tokyo Hospital, Tokyo, Japan Мы предлагаем MARL-Rad — новый фреймворк мультимодального мультиагентного обучения с...
Автор: bintocher|19 марта 2026