Блог о разработке

Статьи о программировании, технологиях и анализе данных

Знакомимся с Gemma 4: мультимодальный ИИ нового уровня, который работает на устройстве
Семейство мультимодальных моделей Gemma 4 от Google DeepMind доступно на Hugging Face — с поддержкой ваших любимых агентов, движков инференса и библиотек для файн-тюнинга 🤗 Это не просто ещё одна...
Автор: bintocher|2 апреля 2026
Nemotron 3 Nano 4B: компактная гибридная модель для эффективного локального ИИ
Представляем Nemotron 3 Nano 4B — самый компактный представитель семейства Nemotron 3. Модель построена на гибридной архитектуре Mamba-Transformer (комбинации рекуррентных слоёв и механизма...
Автор: 585108837|22 марта 2026
Qualcomm сжимает цепочки рассуждений ИИ в 2,4 раза, чтобы запустить «мыслящие» модели на смартфонах
Qualcomm AI Research разработала модульную систему. Она выводит языковые модели с возможностью рассуждения на смартфоны, сжимая многословные мыслительные процессы в 2,4 раза. Современные...
Автор: 585108837|21 марта 2026
Голосовые агенты на устройстве с ExecuTorch: кроссплатформенный фундамент для обработки аудио
Open-source голосовые модели появляются одна за другой, но нет единой нативной платформы для инференса (выполнения моделей) голосовых задач. К таким задачам относятся транскрипция, стриминг в...
Автор: bintocher|20 марта 2026
LlamaIndex выпускает LiteParse: CLI и нативная TypeScript-библиотека для пространственного парсинга PDF в AI-агентах
В текущей реальности Retrieval-Augmented Generation (RAG), главное узкое место для разработчиков — уже не сама большая языковая модель (LLM), а пайплайн загрузки данных. Конвертация сложных...
Автор: bintocher|20 марта 2026
YOLOv26: разбор NMS-Free end-to-end фреймворка для детекции объектов в реальном времени
Фреймворк YOLO («You Only Look Once») долгое время служил эталоном детекции объектов в реальном времени. Однако традиционные итерации (от YOLOv1 до YOLO11) ограничены задержками и чувствительностью к...
Автор: bintocher|19 марта 2026
GTC 2026: Nvidia превращает проблему данных в робототехнике в вычислительную задачу
На конференции GTC 2026 Nvidia существенно расширяет платформу для Physical AI (ИИ, взаимодействующего с физическим миром). Уже с 2027 года беспилотные автомобили Uber выедут на улицы Лос-Анджелеса....
Автор: bintocher|18 марта 2026