Mistral делает ставку на «собери свой AI»: французский стартап бросает вызов OpenAI и Anthropic на корпоративном рынке

Большинство корпоративных AI-проектов проваливаются не из-за нехватки технологий, а потому, что модели не понимают специфику бизнеса. Они обучены на интернет-данных, а не на многолетних внутренних документах, рабочих процессах и накопленной экспертизе компании.

Именно в этом разрыве видит возможность Mistral — французский AI-стартап. Во вторник компания представила Mistral Forge, платформу для создания кастомных моделей, обученных на собственных данных клиентов. Анонс состоялся на Nvidia GTC — ежегодной технологической конференции Nvidia, в этом году сфокусированной на AI и агентных моделях (моделях, способных автономно выполнять цепочки задач) для бизнеса.

Это целенаправленный шаг: Mistral строит бизнес на корпоративных клиентах, тогда как конкуренты OpenAI и Anthropic вырываются вперёд за счёт массового потребителя. CEO Артюр Менш говорит, что фокус на enterprise приносит результаты. По курсу этого года компания превысит $1 млрд годовой рекуррентной выручки (повторяющегося дохода от подписок).

Ключевой элемент этой стратегии — дать компаниям больше контроля над своими данными и AI-системами.

«Forge позволяет предприятиям и правительствам кастомизировать AI-модели под свои конкретные задачи», — рассказывает Элиса Саламанка, head of product Mistral.

Несколько игроков на рынке enterprise AI уже заявляют о похожих возможностях. Но большинство фокусируется на fine-tuning (дообучении) существующих моделей или подключении корпоративных данных через RAG (retrieval augmented generation — поиск релевантных фрагментов из базы данных и подстановку их в запрос к модели). Эти подходы не переобучают модели — они лишь адаптируют или допрашивают их на этапе инференса (генерации ответа) с помощью данных компании.

Mistral же предлагает обучать модели с нуля. Теоретически это позволяет обойти ограничения более популярных подходов: лучше работать с неанглийскими и узкоспециализированными данными, точнее контролировать поведение модели. Кроме того, компании смогут обучать агентные системы с помощью reinforcement learning (обучения с подкреплением — метода, где модель учится через поощрение правильных ответов) и снизить зависимость от сторонних провайдеров — исключив риски вроде изменения или снятия модели с поддержки.

Клиенты Forge могут строить кастомные модели на базе обширной библиотеки open-weight моделей Mistral (моделей с открытыми весами, доступных для свободного скачивания и модификации), включая компактные вроде недавно представленного Mistral Small 4. По словам сооснователя и chief technologist Тимотэ Лакруа, Forge помогает извлечь больше ценности из существующих моделей.

«Компромисс при создании небольших моделей в том, что они не могут быть одинаково хороши на всех темах, как их крупные аналоги. Возможность кастомизации позволяет нам выбирать, что усиливать, а чем жертвовать», — объясняет Лакруа.

Mistral консультирует по выбору моделей и инфраструктуры, но финальное решение остаётся за клиентом. Для команд, которым мало рекомендаций, Forge поставляется с командой forward-deployed engineers (FDE) — инженеров, которые внедряются непосредственно в команды заказчиков, чтобы помочь извлечь правильные данные и адаптироваться к их потребностям. Модель позаимствована у IBM и Palantir.

«Как продукт Forge уже содержит весь инструментарий и инфраструктуру для создания пайплайнов синтетических данных, — говорит Саламанка. — Но понимание того, как строить правильные evals (тесты для оценки качества моделей) и убедиться, что у вас нужный объём данных — здесь у предприятий часто не хватает экспертизы. Именно это FDE привносят в проект».

Mistral уже открыла доступ к Forge для партнёров: Ericsson, Европейского космического агентства, итальянской консалтинговой компании Reply, а также сингапурских DSO и HTX. Среди ранних adopters — ASML, нидерландский производитель чипов, возглавивший раунд Series C Mistral в сентябре при оценке €11,7 млрд (около $13,8 млрд на тот момент).

Эти партнёрства характерны для того, какие use cases Mistral видит как основные для Forge. По словам CRO Маржори Жаниевич, это правительственные организации, которым нужно адаптировать модели под свой язык и культуру; финансовые игроки с высокими требованиями к compliance (соответствию регуляторным нормам); производственные компании с потребностью в кастомизации; а также технологические компании, которым нужно настроить модели под свою кодовую базу.