Блог о разработке

Статьи о программировании, технологиях и анализе данных

DeepSeek V4: Pro (1.6T-A49B) и Flash (284B-A13B) с поддержкой Huawei Ascend

После пары месяцев задержек и слухов DeepSeek наконец выпустила долгожданную DSV4. Это первое крупное обновление архитектуры с декабря 2024 (V3) и января 2025 (R1). Семейство выводит DeepSeek в один...

Тэги:deepseek llm релиз ai/ml

Автор: bintocher|26 апреля 2026

Anthropic обнаружила в Claude «функциональные эмоции», влияющие на его поведение

Команда по интерпретируемости (изучению внутреннего устройства ИИ) Anthropic нашла в Claude Sonnet 4.5 эмоцеподобные представления. Под давлением они могут толкать модель к шантажу и обходным путям в...

Тэги:anthropic llm исследование безопасность

Автор: bintocher|6 апреля 2026

Знакомимся с Gemma 4: мультимодальный ИИ нового уровня, который работает на устройстве

Семейство мультимодальных моделей Gemma 4 от Google DeepMind доступно на Hugging Face — с поддержкой ваших любимых агентов, движков инференса и библиотек для файн-тюнинга 🤗 Это не просто ещё одна...

Тэги:llm hugging face релиз туториал ai/ml edge-вычисления

Автор: bintocher|2 апреля 2026

Aurora

Запуск больших языковых моделей в продакшене — это постоянный компромисс между производительностью и стоимостью. Speculative decoding (спекулятивное декодирование — метод, где маленькая модель...

Тэги:aurora vllm llm релиз ai/ml инфраструктура

Автор: bintocher|2 апреля 2026

AI-модели уверенно описывают изображения, которых никогда не видели, а бенчмарки этого не замечают

Чтобы оценить масштаб проблемы, команда разработала бенчмарк Phantom-0 — 200 визуальных вопросов из 20 категорий, поданных без какого-либо изображения. Все протестированные флагманские модели —...

Тэги:исследование llm ai/ml безопасность

Автор: 585108837|31 марта 2026

Популярный AI-прокси LiteLLM взломан: малварь распространяется по Kubernetes-кластерам

Открытая библиотека LiteLLM, широко используемый прокси для API языковых моделей, была скомпрометирована через PyPI. Исследователь безопасности Callum McMahon из Futuresearch обнаружил, что версии...

Тэги:kubernetes llm уязвимость безопасность

Автор: bintocher|25 марта 2026

Nemotron 3 Nano 4B: компактная гибридная модель для эффективного локального ИИ

Представляем Nemotron 3 Nano 4B — самый компактный представитель семейства Nemotron 3. Модель построена на гибридной архитектуре Mamba-Transformer (комбинации рекуррентных слоёв и механизма...

Тэги:nvidia llm релиз ai/ml edge-вычисления hugging face

Автор: 585108837|22 марта 2026

Китайская модель MiniMax M2.7, как сообщается, участвовала в собственном развитии

MiniMax Китайская AI-компания MiniMax выпустила M2.7 — модель, которая, по заявлению разработчиков, принимала активное участие в собственном создании. Через автономные циклы оптимизации она улучшала...

Тэги:minimax llm агенты релиз

Автор: 585108837|22 марта 2026

Qualcomm сжимает цепочки рассуждений ИИ в 2,4 раза, чтобы запустить «мыслящие» модели на смартфонах

Qualcomm AI Research разработала модульную систему. Она выводит языковые модели с возможностью рассуждения на смартфоны, сжимая многословные мыслительные процессы в 2,4 раза. Современные...

Тэги:llm edge-вычисления qwen исследование

Автор: 585108837|21 марта 2026

Инженеры Stripe запустили Minions — автономные агенты, генерирующие тысячи pull-requests в неделю

Инженеры Stripe разработали Minions — автономные coding-агенты, способные выполнять задачи разработки ПО от начала до конца по одной инструкции. Система связывает большие языковые модели (LLM) с...

Тэги:llm агенты ai/ml devops исследование

Автор: bintocher|20 марта 2026

Обучение speculative decoding в промышленном масштабе на PyTorch

За последний год большие языковые модели стремительно выросли в масштабах и возможностях. Флагманские модели вроде Kimi K2.5, GLM 5 и Qwen 3.5 насчитывают сотни миллиардов параметров и контекстные...

Тэги:llm inference pytorch инфраструктура исследование

Автор: bintocher|20 марта 2026

Знакомство с Mamba-3: новое поколение State Space Model с вдвое меньшим состоянием и более эффективным MIMO-декодированием

Эффективность вычислений на этапе инференса (вывода) стала главным фактором производительности больших языковых моделей (LLM). Фокус архитектурных исследований сместился в сторону оптимизации вывода....

Тэги:llm inference ai/ml исследование

Автор: bintocher|20 марта 2026

ReasoningBank: как заставить AI-агентов эволюционировать через память о рассуждениях

LLM-агенты всё чаще работают в постоянных реальных ролях и сталкиваются с непрерывным потоком задач. Ключевое ограничение: агенты не умеют учиться на накопленном опыте. Они вынуждены отбрасывать...

Тэги:llm агенты gemini исследование ai/ml