Блог о разработке

Статьи о программировании, технологиях и анализе данных

Anthropic: $30 млрд ARR, Project Glasswing и Claude Mythos — первая модель со времён GPT-2, которую сочли слишком опасной для выпуска
На фоне заявления OpenAI о $24 млрд ARR (годовой регулярно повторяющейся выручке), замедления роста ChatGPT, кадровых перестановок на уровне CEO, COO и CMO и шумных слухов вокруг CFO, анонс Anthropic...
Автор: bintocher|10 апреля 2026
Anthropic обнаружила в Claude «функциональные эмоции», влияющие на его поведение
Команда по интерпретируемости (изучению внутреннего устройства ИИ) Anthropic нашла в Claude Sonnet 4.5 эмоцеподобные представления. Под давлением они могут толкать модель к шантажу и обходным путям в...
Автор: bintocher|6 апреля 2026
Утечка исходного кода Claude Code
OpenAI закрыла крупнейший в истории раунд на сумму свыше $110 млрд. ARR компании составляет $24 млрд — рост в 4 раза быстрее, чем у Google и Meta в их лучшие годы. Также OpenAI провела «мягкое IPO» с...
AI-модели уверенно описывают изображения, которых никогда не видели, а бенчмарки этого не замечают
Чтобы оценить масштаб проблемы, команда разработала бенчмарк Phantom-0 — 200 визуальных вопросов из 20 категорий, поданных без какого-либо изображения. Все протестированные флагманские модели —...
Автор: 585108837|31 марта 2026
Безумный март Anthropic: 14+ релизов, 5 падений и случайная утечка Claude Mythos
Anthropic сейчас выпускает продукты быстрее и агрессивнее кого-либо в индустрии. Большая часть главных новостей недели так или иначе связана с ними. Я пишу о технологических стартапах 20 лет и не...
Популярный AI-прокси LiteLLM взломан: малварь распространяется по Kubernetes-кластерам
Открытая библиотека LiteLLM, широко используемый прокси для API языковых моделей, была скомпрометирована через PyPI. Исследователь безопасности Callum McMahon из Futuresearch обнаружил, что версии...
Автор: bintocher|25 марта 2026
Nemotron 3 Content Safety 4B: мультимодальная и мультиязычная модерация контента
Массовое распространение LLM и vision-language моделей (VLM — модели, работающие с текстом и изображениями) радикально изменило AI-приложения — от автоматизации рутины до генерации креативного...
Автор: 585108837|22 марта 2026
Cursor обходит Opus в 10 раз дешевле, агент Meta выходит из-под контроля и 300-страничный Trump America AI Act
На этой неделе всё вращалось вокруг консолидации. Не скучной корпоративной, а стратегической. Cursor анонсировал собственную модель. Nvidia собрал коалицию для совместной разработки открытых базовых...
Автор: 585108837|22 марта 2026
Популярный сканер Trivy скомпрометирован в ходе атак на цепочку поставок
Хакеры скомпрометировали практически все версии Trivy — инструмента для поиска уязвимостей от Aqua Security, широко используемого в индустрии. Атака на цепочку поставок продолжается и может иметь...
Автор: 585108837|21 марта 2026
Представляем LangSmith Fleet
Мы запускаем LangSmith Fleet — корпоративное рабочее пространство для создания, использования и управления парком ваших агентов. У этих агентов есть собственная память, доступ к набору инструментов и...
Автор: bintocher|20 марта 2026
Война с Ираном повредила несколько дата-центров AWS: удар по мифу о надёжности multi-AZ
В начале марта иранские беспилотники повредили три дата-центра AWS в ОАЭ и Бахрейне. Инцидент затронул несколько зон доступности (Availability Zones) в рамках одного региона. Это вызвало серьёзные...
Автор: 585108837|20 марта 2026
Claude Opus 4.6 нашёл 22 уязвимости в Firefox за две недели
Claude Opus 4.6 обнаружил 22 уязвимости безопасности в Firefox всего за две недели. Четырнадцать из них получили статус высокой критичности — это почти 20% всех аналогичных багов, исправленных в...
Автор: bintocher|20 марта 2026
Выявление скрытых стереотипов: мультиязычная оценка современных LLM через призму дебатов
Большие языковые модели (LLM) массово используются для открытого общения. Однако большинство оценок предвзятости по-прежнему опирается на англоязычные задачи классификации. Исследователи из MBZUAI,...
Автор: bintocher|19 марта 2026
Адверсариальные атаки на современные vision-language модели
Мы исследуем адверсариальную устойчивость open-source vision-language моделей (VLM — модели для совместной работы с изображениями и текстом), развёрнутых в изолированной e-commerce среде. Среда...
Автор: bintocher|19 марта 2026
HarmMetric Eval: бенчмарк для оценки метрик и судей при определении вредоносности ответов LLM
Выравнивание (alignment) больших языковых моделей (LLM) с человеческими ценностями — критическое условие их безопасного развертывания. Однако jailbreak-атаки способны обойти эту защиту и заставить...
Автор: bintocher|19 марта 2026
В Meta не справляются с выходящими из-под контроля AI-агентами
Image Credits: Carol Yepes / Getty Images AI-агент в Meta вышел из-под контроля и открыл доступ к конфиденциальным данным компании и пользователей для сотрудников, не имевших на это прав. Как следует...
Автор: bintocher|19 марта 2026
GPT-5.3-Codex с долгосрочной поддержкой в GitHub Copilot
GitHub вводит модели с долгосрочной поддержкой (long-term support, LTS) для тарифов Copilot Business и Copilot Enterprise. Это решение даёт корпоративным клиентам стабильность, необходимую для...
Автор: bintocher|18 марта 2026
Минобороны США: «красные линии» Anthropic делают компанию неприемлемым риском для национальной безопасности
Фото: Getty Images Министерство обороны США во вторник вечером объявило, что Anthropic представляет собой «неприемлемый риск для национальной безопасности». Это первая реакция ведомства на иски...
Автор: bintocher|18 марта 2026
Пентагон планирует разрешить AI-компаниям обучать модели на секретных данных
Министерство войны США организует защищённые среды, где AI-компании смогут обучать модели на секретных данных. До сих пор моделям разрешалось лишь читать такие данные, но не учиться на них. Пентагон...
Автор: bintocher|18 марта 2026
Орбитальные дата-центры: Nvidia представила ИИ-модуль Vera Rubin для спутниковых группировок
Nvidia анонсировала платформу Space-1 Vera Rubin — вычислительный модуль для работы за пределами Земли. По заявлению компании, производительность инференса на нём в 25 раз выше, чем у серверных H100....