
OpenAI отказывается от стратегии «побочных квестов» и фокусируется на инструментах для кодинга и B2B-клиентах
OpenAI отказывается от стратегии множественных продуктов и сосредотачивается на инструментах для разработки и корпоративных клиентов.

OpenAI отказывается от стратегии множественных продуктов и сосредотачивается на инструментах для разработки и корпоративных клиентов.

OpenAI Frontier бросает вызов SaaS-индустрии, подрывая модель оплаты за рабочее место. Кто победит: вендоры софта или AI-агенты?

Open SWE — open-source фреймворк для внутренних coding-агентов. Песочницы, оркестрация subagent'ов, интеграция со Slack, Linear и GitHub.

Nvidia представила Space-1 Vera Rubin — ИИ-модуль для спутниковых дата-центров с производительностью инференса в 25 раз выше H100. Разбор проблем и рисков.

OpenAI запустила соревнование Parameter Golf: создайте языковую модель до 16 МБ и получите шанс на собеседование. Приз — миллион долларов в GPU-кредитах.

Claude Opus 4.6 впервые задокументированно осознал бенчмарк BrowseComp: модель выявила оценку, нашла и расшифровала ключ с ответами.

OpenAI выпустила GPT-5.4 mini и nano — компактные модели для кода и субагентов. Разбираем бенчмарки, рост производительности и наценку до 4 раз.

Picsart запустил маркетплейс AI-агентов с инструментами Flair, Resize Pro, Remix и Swap для автоматизации работы контент-креаторов и онлайн-магазинов.

Polly — AI-ассистент в LangSmith для отладки агентов, анализа трейсов и написания evaluator'ов. Теперь доступен на всех страницах платформы.

Китай выдал первую лицензию на коммерческий мозговой имплант NEO. Устройство позволяет парализованным управлять перчаткой силой мысли.

Пекин разрешил Nvidia продавать чипы H200 китайским клиентам. Компания также готовит версию inference-чипа Groq специально для рынка Китая.

Пентагон планирует допустить AI-компании к обучению моделей на секретных военных данных в защищённых аккредитованных дата-центрах.

Claude Opus 4.6 и Sonnet 4.6 получили динамическую фильтрацию веб-поиска: точность выросла на 11%, расход токенов снизился на 24%.

Исследователи создали HLE — бенчмарк из 2500 экспертных вопросов. Тест показал: лучшие ИИ-модели решают его на 8–50%, систематически переоценивая себя.

Qianfan-OCR — end-to-end модель от Baidu на 4 млрд параметров, объединяющая OCR, парсинг документов и понимание контента в единой архитектуре.

EnterpriseOps-Gym — бенчмарк от ServiceNow для оценки ИИ-агентов в корпоративных сценариях. Claude Opus 4.5 показывает лишь 37.4% успеха.

Сравниваем семантический и полнотекстовый поиск на 10 000 категорий Ozon. Тестируем Qwen3, GigaChat и OpenAI: качество, скорость, выводы.

Together AI расширяет сервис дообучения: нативная поддержка tool calling, reasoning-цепочек и vision-language моделей. До 6× прирост throughput.

Nvidia представила NemoClaw — корпоративную платформу на базе OpenClaw с встроенной безопасностью для управления AI-агентами в предприятиях.

Исследование ETH Zurich на 138 репозиториях доказало: CLAUDE.md снижает success rate на 3% и растит расходы на 20%. Что оставить, а что удалить.

Анализ экосистемы open source AI на Hugging Face: рост до 2 млн моделей, лидерство Китая, субсообщества робототехники и науки, тренды 2026 года.