Блог о разработке

Статьи о программировании, технологиях и анализе данных

Знакомимся с Gemma 4: мультимодальный ИИ нового уровня, который работает на устройстве

Семейство мультимодальных моделей Gemma 4 от Google DeepMind доступно на Hugging Face — с поддержкой ваших любимых агентов, движков инференса и библиотек для файн-тюнинга 🤗 Это не просто ещё одна...

Тэги:llm hugging face релиз туториал ai/ml edge-вычисления

Автор: bintocher|2 апреля 2026

Nemotron 3 Nano 4B: компактная гибридная модель для эффективного локального ИИ

Представляем Nemotron 3 Nano 4B — самый компактный представитель семейства Nemotron 3. Модель построена на гибридной архитектуре Mamba-Transformer (комбинации рекуррентных слоёв и механизма...

Тэги:nvidia llm релиз ai/ml edge-вычисления hugging face

Автор: 585108837|22 марта 2026

Qualcomm сжимает цепочки рассуждений ИИ в 2,4 раза, чтобы запустить «мыслящие» модели на смартфонах

Qualcomm AI Research разработала модульную систему. Она выводит языковые модели с возможностью рассуждения на смартфоны, сжимая многословные мыслительные процессы в 2,4 раза. Современные...

Тэги:llm edge-вычисления qwen исследование

Автор: 585108837|21 марта 2026

Голосовые агенты на устройстве с ExecuTorch: кроссплатформенный фундамент для обработки аудио

Open-source голосовые модели появляются одна за другой, но нет единой нативной платформы для инференса (выполнения моделей) голосовых задач. К таким задачам относятся транскрипция, стриминг в...

Тэги:executorch релиз edge-вычисления агенты

Автор: bintocher|20 марта 2026

LlamaIndex выпускает LiteParse: CLI и нативная TypeScript-библиотека для пространственного парсинга PDF в AI-агентах

В текущей реальности Retrieval-Augmented Generation (RAG), главное узкое место для разработчиков — уже не сама большая языковая модель (LLM), а пайплайн загрузки данных. Конвертация сложных...

Тэги:релиз ai/ml агенты rag edge-вычисления

Автор: bintocher|20 марта 2026

YOLOv26: разбор NMS-Free end-to-end фреймворка для детекции объектов в реальном времени

Фреймворк YOLO («You Only Look Once») долгое время служил эталоном детекции объектов в реальном времени. Однако традиционные итерации (от YOLOv1 до YOLO11) ограничены задержками и чувствительностью к...

Тэги:yolov26 обзор ai/ml edge-вычисления

Автор: bintocher|19 марта 2026

GTC 2026: Nvidia превращает проблему данных в робототехнике в вычислительную задачу

На конференции GTC 2026 Nvidia существенно расширяет платформу для Physical AI (ИИ, взаимодействующего с физическим миром). Уже с 2027 года беспилотные автомобили Uber выедут на улицы Лос-Анджелеса....

Тэги:nvidia релиз ai/ml робототехника edge-вычисления

Автор: bintocher|18 марта 2026