Блог о разработке
Статьи о программировании, технологиях и анализе данных

Выравнивание (alignment) больших языковых моделей (LLM) с человеческими ценностями — критическое условие их безопасного развертывания. Однако jailbreak-атаки способны обойти эту защиту и заставить...
Автор: bintocher|19 марта 2026

Биомедицинские исследователи всё чаще используют крупные структурированные базы данных для сложной аналитики. Но современные системы text-to-SQL (перевод текста в SQL-запросы) плохо справляются с...
Автор: bintocher|19 марта 2026

OpenAI бросила вызов исследователям: создать лучшую языковую модель, уложившись всего в 16 МБ. Компания использует это соревнование для поиска кадров. В открытом исследовательском конкурсе «Parameter...
Автор: bintocher|18 марта 2026

Модели искусственного интеллекта размножаются стремительно, а конкуренция накаляется. При таком количестве игроков на рынке какая модель окажется лучшей — и кто это решает? Arena (ранее LM Arena)...

Министерство войны США организует защищённые среды, где AI-компании смогут обучать модели на секретных данных. До сих пор моделям разрешалось лишь читать такие данные, но не учиться на них. Пентагон...
Автор: bintocher|18 марта 2026

Nvidia анонсировала платформу Space-1 Vera Rubin — вычислительный модуль для работы за пределами Земли. По заявлению компании, производительность инференса на нём в 25 раз выше, чем у серверных H100....
Автор: bintocher|18 марта 2026

10 марта Google выпустил Gemini Embedding 2 — эмбеддинг-модель (превращает данные в числовые векторы для поиска по смыслу). Она работает не только с текстом, но и с картинками, видео, аудио и PDF....

Научный подход не допускает веры на слово — любое утверждение становится фактом только после проверки. Знания не исключение: школы и университеты измеряют их экзаменами. С появлением генеративных ИИ...
Автор: bintocher|18 марта 2026

Большинство корпоративных AI-проектов проваливаются не из-за нехватки технологий, а потому, что модели не понимают специфику бизнеса. Они обучены на интернет-данных, а не на многолетних внутренних...

BrowseComp — бенчмарк (набор тестов), проверяющий, насколько хорошо модели находят труднообнаружимую информацию в интернете. Как и многие бенчмарки, он уязвим к загрязнению данных. Ответы утекают в...
Автор: bintocher|18 марта 2026

Как изменился ландшафт open source AI за прошедший год в сфере конкуренции, географии, технических трендов и зарождающихся сообществ. Мы анализируем активность на Hugging Face по множеству метрик,...
Автор: bintocher|18 марта 2026

Mistral AI выпустила Mistral Small 4 — модель, объединяющую быстрые текстовые ответы, логическое рассуждение и обработку изображений. В ней 119 млрд параметров, но на каждый запрос активны лишь 6...
Автор: bintocher|18 марта 2026

Состоялась конференция NVIDIA GTC. В ходе своего двухчасового keynote без суфлёра Дженсен Хуанг прошёлся по всей экосистеме NVIDIA и торжественно преподнёс свой пояс чемпиона InferenceMAX. Blackwell...

Большие языковые модели (LLM) переходят от формата диалога к автономным агентам. Такие агенты способны выполнять сложные профессиональные workflows. Однако их реальное внедрение в корпоративной среде...
Автор: bintocher|18 марта 2026

Мне тут идея пришла в ходе новостей начала 2026 года, очень много появилось опен-сорс решений которые позволяют вести локальные разработки и быть просто помощниками в любую минуту - что захотелось...