Блог о разработке
Статьи о программировании, технологиях и анализе данных

Семейство мультимодальных моделей Gemma 4 от Google DeepMind доступно на Hugging Face — с поддержкой ваших любимых агентов, движков инференса и библиотек для файн-тюнинга 🤗 Это не просто ещё одна...
Автор: bintocher|2 апреля 2026

Представляем Nemotron 3 Nano 4B — самый компактный представитель семейства Nemotron 3. Модель построена на гибридной архитектуре Mamba-Transformer (комбинации рекуррентных слоёв и механизма...
Автор: 585108837|22 марта 2026

Qualcomm AI Research разработала модульную систему. Она выводит языковые модели с возможностью рассуждения на смартфоны, сжимая многословные мыслительные процессы в 2,4 раза. Современные...
Автор: 585108837|21 марта 2026

Open-source голосовые модели появляются одна за другой, но нет единой нативной платформы для инференса (выполнения моделей) голосовых задач. К таким задачам относятся транскрипция, стриминг в...
Автор: bintocher|20 марта 2026

В текущей реальности Retrieval-Augmented Generation (RAG), главное узкое место для разработчиков — уже не сама большая языковая модель (LLM), а пайплайн загрузки данных. Конвертация сложных...
Автор: bintocher|20 марта 2026

Фреймворк YOLO («You Only Look Once») долгое время служил эталоном детекции объектов в реальном времени. Однако традиционные итерации (от YOLOv1 до YOLO11) ограничены задержками и чувствительностью к...
Автор: bintocher|19 марта 2026

На конференции GTC 2026 Nvidia существенно расширяет платформу для Physical AI (ИИ, взаимодействующего с физическим миром). Уже с 2027 года беспилотные автомобили Uber выедут на улицы Лос-Анджелеса....
Автор: bintocher|18 марта 2026