Блог о разработке

Статьи о программировании, технологиях и анализе данных

Aurora

Запуск больших языковых моделей в продакшене — это постоянный компромисс между производительностью и стоимостью. Speculative decoding (спекулятивное декодирование — метод, где маленькая модель...

Тэги:aurora vllm llm релиз ai/ml инфраструктура

Автор: bintocher|2 апреля 2026

GIFT: глобальная оптимальность пост-тренинга через Gibbs-инициализацию при конечной температуре

Исследователи из Peking University и Meituan предлагают GIFT. Это метод инициализации для пост-тренинга Large Reasoning Models (LRM — больших моделей для логических рассуждений). Метод устраняет...

Тэги:llm qwen vllm исследование ai/ml

Автор: bintocher|19 марта 2026

Mistral AI выпустила Mistral Small 4: 119B-параметровая MoE-модель, объединяющая инструкции, рассуждения и мультимодальность

Mistral AI представила Mistral Small 4 — новую модель в линейке Mistral Small, которая сводит несколько ранее раздельных возможностей в единую точку развёртывания. Команда Mistral описывает Small 4...

Тэги:mistral small 4 vllm релиз ai/ml

Автор: bintocher|18 марта 2026