
Обучение speculative decoding в промышленном масштабе на PyTorch
Фреймворк TorchSpec для обучения speculative decoding: disaggregated-архитектура, стриминг через Mooncake по RDMA, кейс EAGLE-3 для Kimi K2.5 на H200.

Фреймворк TorchSpec для обучения speculative decoding: disaggregated-архитектура, стриминг через Mooncake по RDMA, кейс EAGLE-3 для Kimi K2.5 на H200.

OpenAI переработала интерфейс выбора моделей в ChatGPT: теперь доступны уровни Instant, Thinking и Pro вместо конкретных названий.

LlamaIndex выпустил LiteParse — нативную TypeScript-библиотеку для пространственного парсинга PDF. Локальная обработка, скриншоты страниц, интеграция с RAG-пайплайнами.

LangSmith Fleet — рабочее пространство для создания, совместного использования и управления парком ИИ-агентов с идентичностью и observability.

OpenAI приобретает стартап Astral, создавший uv, Ruff и ty. Инструменты попадут в Codex, но будущее open-source-развития остаётся неясным.

Иранские удары по дата-центрам AWS в ОАЭ и Бахрейне показали, что архитектура multi-AZ не защищает от боевых действий. Уроки для облачных архитекторов.

Mamba-3 — новое поколение State Space Model с экспоненциально-трапецеидальной дискретизацией, комплекснозначными SSM и эффективным MIMO-декодированием.

Cursor выпустил Composer 2 — модель для кода, которая обходит Claude Opus 4.6 на бенчмарках при цене в разы ниже. Главная инновация — self-summarization.

Claude Opus 4.6 обнаружил 22 уязвимости в Firefox за две недели, 14 из которых высокой критичности. Anthropic также создала эксплойты для части багов.

MiniMax 2.7 достигла SOTA среди открытых моделей по качеству GLM-5, но стоит втрое дешевле. Обзор самоэволюции, harness-инжиниринга и трендов AI-агентов.

Исследование устойчивости open-source VLM-моделей LLaVA и Qwen2.5-VL к градиентным атакам BIM, PGD и CLIP-спектральной в e-commerce среде.

Пайплайн автоматической генерации синтетических ML-задач для обучения AI-агентов. Qwen3 показывает прирост до 12% AUP на бенчмарке MLGym.

AgriChat — мультимодальная LLM для анализа сельхозизображений. Датасет AgriMM на 607 тыс. VQA-пар, конвейер V2VK, SOTA в диагностике болезней растений.
Anthropic запустила акцию с удвоением лимитов Claude для тарифов Free, Pro, Max и Team. Действует по выходным в непиковые часы до 28 марта 2026.

Bridge Diffusion Model — архитектура, объединяющая китайские text-to-image модели с англоязычной экосистемой: LoRA, ControlNet, Dreambooth.

BiomedSQL — первый бенчмарк для оценки text-to-SQL моделей на задачах научного рассуждения над биомедицинскими базами знаний. Результаты LLM и анализ.

Google DeepMind расширил Gemini API: теперь встроенные сервисы можно комбинировать с кастомными функциями через context circulation.

Google Labs развернул Stitch в полноценную AI-платформу для проектирования UI по тексту. Vibe design, голосовое управление, прототипы и MCP-интеграция.

GIFT устраняет разрыв между SFT и RL в обучении LRM через Gibbs-инициализацию при конечной температуре, обеспечивая глобальную оптимальность.

GPT 5.4 в Codex — заметный шаг вперёд по корректности, удобству, скорости и стоимости. Сравнение с Claude, управление контекстом и fast mode.

HarmMetric Eval — бенчмарк для оценки метрик вредоносности LLM. Главный вывод: METEOR и ROUGE-1 превосходят LLM-судей в определении вредоносных ответов.