Блог о разработке

Статьи о программировании, технологиях и анализе данных

Исчезающий средний класс ИИ
За 24 часа на прошлой неделе OpenAI и DeepSeek сделали взаимоисключающие ставки на то, сколько стоит frontier-ИИ (модели самого высокого уровня). Один говорит: это закрытый продукт, который только...
Автор: bintocher|30 апреля 2026
Эксклюзивный тур по чиповой лаборатории Amazon: процессор Trainium, который покорил Anthropic, OpenAI и даже Apple
Вскоре после того как CEO Amazon Энди Джасси объявил о исторической инвестиционной сделке AWS с OpenAI на $50 млрд, Amazon пригласил меня на закрытый тур по лаборатории разработки чипов — сердцу этой...
Автор: 585108837|22 марта 2026
Обучение speculative decoding в промышленном масштабе на PyTorch
За последний год большие языковые модели стремительно выросли в масштабах и возможностях. Флагманские модели вроде Kimi K2.5, GLM 5 и Qwen 3.5 насчитывают сотни миллиардов параметров и контекстные...
Автор: bintocher|20 марта 2026
Знакомство с Mamba-3: новое поколение State Space Model с вдвое меньшим состоянием и более эффективным MIMO-декодированием
Эффективность вычислений на этапе инференса (вывода) стала главным фактором производительности больших языковых моделей (LLM). Фокус архитектурных исследований сместился в сторону оптимизации вывода....
Автор: bintocher|20 марта 2026
NV-Bench: бенчмарк для синтеза невербальных вокализаций в выразительном Text-to-Speech
Современные системы text-to-speech (TTS) всё активнее интегрируют невербальные вокализации (NV) — звуки вне речи, такие как смех, вздохи или междометия. Но их оценка лишена стандартизированных метрик...
Автор: bintocher|19 марта 2026
Bridge Diffusion Model: как соединить китайские text-to-image модели с английским сообществом
Технологии генерации изображений по тексту (Text-to-Image, TTI) развиваются стремительно, но преимущественно в англоязычном сообществе. Проблема не сводится к языку ввода. Англоязычные модели несут...
Автор: bintocher|19 марта 2026
Пекин разрешил Nvidia продавать чипы H200, а компания готовит китайскую версию inference-чипа Groq
Nvidia получила разрешение Пекина на продажу своих вторых по мощности AI-чипов H200 китайским клиентам, сообщает Reuters. В прошлом году компания остановила производство этих чипов из-за регуляторных...
Автор: bintocher|18 марта 2026
Орбитальные дата-центры: Nvidia представила ИИ-модуль Vera Rubin для спутниковых группировок
Nvidia анонсировала платформу Space-1 Vera Rubin — вычислительный модуль для работы за пределами Земли. По заявлению компании, производительность инференса на нём в 25 раз выше, чем у серверных H100....
Как Amazon обогнала NVIDIA на три дня — и, возможно, изменила будущее ИИ-железа
Через несколько минут после публикации этой статьи NVIDIA представит то, что ещё недавно считалось бы первым в отрасли: disaggregated-решение (архитектура с физически разделёнными компонентами для...
NVIDIA GTC: Дженсен атакует OpenClaw, представляет Vera CPU и заявляет о бэклоге на $1 трлн к 2027 году
Состоялась конференция NVIDIA GTC. В ходе своего двухчасового keynote без суфлёра Дженсен Хуанг прошёлся по всей экосистеме NVIDIA и торжественно преподнёс свой пояс чемпиона InferenceMAX. Blackwell...
Автор: bintocher|18 марта 2026