Блог о разработке

Статьи о программировании, технологиях и анализе данных

TDMM-LM: как языковые модели объединили понимание и анимацию лиц

Мультимодальные большие языковые модели (MLLM) существенно продвинули визуальное понимание, но мелкая мимика по-прежнему остаётся слабым местом. Главная проблема — неэффективность токенов....

Тэги:llm исследование ai/ml

Автор: bintocher|19 марта 2026

GIFT: глобальная оптимальность пост-тренинга через Gibbs-инициализацию при конечной температуре

Исследователи из Peking University и Meituan предлагают GIFT. Это метод инициализации для пост-тренинга Large Reasoning Models (LRM — больших моделей для логических рассуждений). Метод устраняет...

Тэги:llm qwen vllm исследование ai/ml

Автор: bintocher|19 марта 2026

HarmMetric Eval: бенчмарк для оценки метрик и судей при определении вредоносности ответов LLM

Выравнивание (alignment) больших языковых моделей (LLM) с человеческими ценностями — критическое условие их безопасного развертывания. Однако jailbreak-атаки способны обойти эту защиту и заставить...

Тэги:llm исследование безопасность

Автор: bintocher|19 марта 2026

BiomedSQL: Text-to-SQL для научного рассуждения над биомедицинскими базами знаний

Биомедицинские исследователи всё чаще используют крупные структурированные базы данных для сложной аналитики. Но современные системы text-to-SQL (перевод текста в SQL-запросы) плохо справляются с...

Тэги:исследование ai/ml llm агенты hugging face

Автор: bintocher|19 марта 2026

OpenAI превращает сжатие моделей в охоту за талантами с соревнованием «Parameter Golf» на 16 МБ

OpenAI бросила вызов исследователям: создать лучшую языковую модель, уложившись всего в 16 МБ. Компания использует это соревнование для поиска кадров. В открытом исследовательском конкурсе «Parameter...

Тэги:openai llm ai/ml исследование бизнес