Блог о разработке

Статьи о программировании, технологиях и анализе данных

LlamaIndex выпускает LiteParse: CLI и нативная TypeScript-библиотека для пространственного парсинга PDF в AI-агентах
В текущей реальности Retrieval-Augmented Generation (RAG), главное узкое место для разработчиков — уже не сама большая языковая модель (LLM), а пайплайн загрузки данных. Конвертация сложных...
Автор: bintocher|20 марта 2026
AgriChat: мультимодальная LLM для анализа сельскохозяйственных изображений
Irfan Hussain, Sajid Javed — Департамент компьютерных наук, Университет Халифа, Абу-Даби, ОАЭ Применение Multimodal Large Language Models (MLLM) в сельском хозяйстве упирается в критический...
Автор: bintocher|19 марта 2026
Gemini Embedding 2 и мультимодальный RAG: эмбеддим видео и картинки — разбор и туториал
10 марта Google выпустил Gemini Embedding 2 — эмбеддинг-модель (превращает данные в числовые векторы для поиска по смыслу). Она работает не только с текстом, но и с картинками, видео, аудио и PDF....
Автор: bintocher|18 марта 2026