Блог о разработке

Статьи о программировании, технологиях и анализе данных

Qwen3.5-Omni научился писать код по голосовым инструкциям и видео без специального обучения
Alibaba выпустила Qwen3.5-Omni — omnimodal-модель (работает с текстом, изображениями, аудио и видео как с единым потоком). По заявлению разработчиков, она обходит Gemini 3.1 Pro по аудиозадачам, а...
Автор: bintocher|31 марта 2026
Qualcomm сжимает цепочки рассуждений ИИ в 2,4 раза, чтобы запустить «мыслящие» модели на смартфонах
Qualcomm AI Research разработала модульную систему. Она выводит языковые модели с возможностью рассуждения на смартфоны, сжимая многословные мыслительные процессы в 2,4 раза. Современные...
Автор: 585108837|21 марта 2026
AI-учёный через масштабирование синтетических задач
Зиян Цай — Принстонский университет Харкират Бехл — Microsoft Research С появлением AI-агентов автоматические научные открытия стали реальной целью. Многие недавние работы строят агентные системы для...
Автор: bintocher|19 марта 2026
Адверсариальные атаки на современные vision-language модели
Мы исследуем адверсариальную устойчивость open-source vision-language моделей (VLM — модели для совместной работы с изображениями и текстом), развёрнутых в изолированной e-commerce среде. Среда...
Автор: bintocher|19 марта 2026
GIFT: глобальная оптимальность пост-тренинга через Gibbs-инициализацию при конечной температуре
Исследователи из Peking University и Meituan предлагают GIFT. Это метод инициализации для пост-тренинга Large Reasoning Models (LRM — больших моделей для логических рассуждений). Метод устраняет...
Автор: bintocher|19 марта 2026
Qianfan-OCR от Baidu: единая модель для работы с документами на 4 млрд параметров
Команда Baidu Qianfan представила Qianfan-OCR — end-to-end модель (обрабатывающая данные от начала до конца без промежуточных этапов) на 4 млрд параметров. Она объединяет парсинг документов, анализ...
Автор: bintocher|18 марта 2026
Together AI расширяет сервис дообучения: поддержка tool calling, reasoning и работы с изображениями
При переходе от однократных запросов к сложным многошаговым workflow надёжность моделей ломается в предсказуемых местах. Tool-вызовы не соответствуют схемам. Качество reasoning (цепочек рассуждений)...
Автор: bintocher|18 марта 2026
Семантический поиск против полнотекстового: тестим три embedding-модели на 10 000 категорий Ozon
Идея семантического поиска — представить и документы, и запрос в виде числовых векторов. Такие векторы называют эмбеддингами (embeddings). Близкие по смыслу тексты получают близкие векторы. Для...
Автор: bintocher|18 марта 2026
Как за неделю создать полноценный сервис, используя разные AI-модели? Разбираем Cursor в бою!
Прямо сейчас тысячи разработчиков тратят часы на рутину, когда уже можно создать полноценный сервис за 1 неделю с помощью AI! Подписывайтесь чтобы быть в курсе: мой канал: https://t.me/chernovdev вк...
Автор: bintocher|27 января 2026