Блог о разработке

Статьи о программировании, технологиях и анализе данных

Aurora
Запуск больших языковых моделей в продакшене — это постоянный компромисс между производительностью и стоимостью. Speculative decoding (спекулятивное декодирование — метод, где маленькая модель...
Автор: bintocher|2 апреля 2026
GIFT: глобальная оптимальность пост-тренинга через Gibbs-инициализацию при конечной температуре
Исследователи из Peking University и Meituan предлагают GIFT. Это метод инициализации для пост-тренинга Large Reasoning Models (LRM — больших моделей для логических рассуждений). Метод устраняет...
Автор: bintocher|19 марта 2026
Mistral AI выпустила Mistral Small 4: 119B-параметровая MoE-модель, объединяющая инструкции, рассуждения и мультимодальность
Mistral AI представила Mistral Small 4 — новую модель в линейке Mistral Small, которая сводит несколько ранее раздельных возможностей в единую точку развёртывания. Команда Mistral описывает Small 4...
Автор: bintocher|18 марта 2026