Блог о разработке

Статьи о программировании, технологиях и анализе данных

Наглядный гайд по Gemma 4 12B

Новая модель Gemma 4 вышла, и она интересная. Между E4B и 26B A4B была пустота, и 12B-модель заняла её органично. Но это Google DeepMind — без архитектурного эксперимента не обошлось. Так в чём же...

Тэги:llm inference туториал ai/ml

Автор: bintocher|4 июня 2026

Исчезающий средний класс ИИ

За 24 часа на прошлой неделе OpenAI и DeepSeek сделали взаимоисключающие ставки на то, сколько стоит frontier-ИИ (модели самого высокого уровня). Один говорит: это закрытый продукт, который только...

Тэги:openai deepseek ai/ml мнение inference

Автор: bintocher|30 апреля 2026

Эксклюзивный тур по чиповой лаборатории Amazon: процессор Trainium, который покорил Anthropic, OpenAI и даже Apple

Вскоре после того как CEO Amazon Энди Джасси объявил о исторической инвестиционной сделке AWS с OpenAI на $50 млрд, Amazon пригласил меня на закрытый тур по лаборатории разработки чипов — сердцу этой...

Тэги:aws inference ai/ml инфраструктура бизнес обзор

Автор: 585108837|22 марта 2026

Обучение speculative decoding в промышленном масштабе на PyTorch

За последний год большие языковые модели стремительно выросли в масштабах и возможностях. Флагманские модели вроде Kimi K2.5, GLM 5 и Qwen 3.5 насчитывают сотни миллиардов параметров и контекстные...

Тэги:llm inference pytorch инфраструктура исследование

Автор: bintocher|20 марта 2026

Знакомство с Mamba-3: новое поколение State Space Model с вдвое меньшим состоянием и более эффективным MIMO-декодированием

Эффективность вычислений на этапе инференса (вывода) стала главным фактором производительности больших языковых моделей (LLM). Фокус архитектурных исследований сместился в сторону оптимизации вывода....

Тэги:llm inference ai/ml исследование

Автор: bintocher|20 марта 2026

NV-Bench: бенчмарк для синтеза невербальных вокализаций в выразительном Text-to-Speech

Современные системы text-to-speech (TTS) всё активнее интегрируют невербальные вокализации (NV) — звуки вне речи, такие как смех, вздохи или междометия. Но их оценка лишена стандартизированных метрик...

Тэги:tts inference ai/ml исследование

Автор: bintocher|19 марта 2026

Bridge Diffusion Model: как соединить китайские text-to-image модели с английским сообществом

Технологии генерации изображений по тексту (Text-to-Image, TTI) развиваются стремительно, но преимущественно в англоязычном сообществе. Проблема не сводится к языку ввода. Англоязычные модели несут...

Тэги:ai/ml исследование inference

Автор: bintocher|19 марта 2026

Пекин разрешил Nvidia продавать чипы H200, а компания готовит китайскую версию inference-чипа Groq

Nvidia получила разрешение Пекина на продажу своих вторых по мощности AI-чипов H200 китайским клиентам, сообщает Reuters. В прошлом году компания остановила производство этих чипов из-за регуляторных...

Тэги:nvidia groq inference ai/ml бизнес

Автор: bintocher|18 марта 2026

Орбитальные дата-центры: Nvidia представила ИИ-модуль Vera Rubin для спутниковых группировок

Nvidia анонсировала платформу Space-1 Vera Rubin — вычислительный модуль для работы за пределами Земли. По заявлению компании, производительность инференса на нём в 25 раз выше, чем у серверных H100....

Тэги:nvidia vera rubin ai/ml llm inference релиз инфраструктура безопасность

Автор: bintocher|18 марта 2026

Как Amazon обогнала NVIDIA на три дня — и, возможно, изменила будущее ИИ-железа

Через несколько минут после публикации этой статьи NVIDIA представит то, что ещё недавно считалось бы первым в отрасли: disaggregated-решение (архитектура с физически разделёнными компонентами для...

Тэги:nvidia groq inference инфраструктура исследование бизнес

Автор: bintocher|18 марта 2026

NVIDIA GTC: Дженсен атакует OpenClaw, представляет Vera CPU и заявляет о бэклоге на $1 трлн к 2027 году

Состоялась конференция NVIDIA GTC. В ходе своего двухчасового keynote без суфлёра Дженсен Хуанг прошёлся по всей экосистеме NVIDIA и торжественно преподнёс свой пояс чемпиона InferenceMAX. Blackwell...

Тэги:nvidia llm inference ai/ml обзор

Автор: bintocher|18 марта 2026