Дайджест ИИ: главные события недели 24–28 марта 2026
TL;DR: OpenAI закрыла Sora и потеряла Disney. Anthropic выиграла суд у Пентагона и случайно раскрыла данные о Claude Mythos. Google выпустила Gemini 3.1 Flash Live и TurboQuant. Figma открыла канвас для AI-агентов. Reddit вводит биометрическую верификацию. Mistral и Cohere выпустили open-source аудио-модели. ChatGPT получил облачное хранилище. Claude Code — auto mode и auto-dream. Cursor учится в реальном времени. И ещё 15+ событий — всё в одном дайджесте.
Неделя выдалась одной из самых насыщенных в этом году: гонка следующего поколения моделей вышла из тени через утечки и слухи, open-source сообщество дало ответ корпоративным разработкам, а несколько крупных игроков пересмотрели стратегии. Разберём всё по порядку — ни одной новости не пропустим.
Содержание
- OpenAI: конец Sora, Codex-плагины и реклама за $60 CPM
- Anthropic: утечка Claude Mythos, победа в суде и computer use на Mac
- Google: Gemini 3.1 Flash Live, TurboQuant и AI-браузер
- Open-source волна: аудио, агентный поиск, квантизация
- ARC-AGI-3: люди 100%, модели <1%
- Инструменты разработчика: Figma, Claude Code, Cursor, Codex
- ChatGPT Library: 10 ГБ облака и память о файлах
- Безопасность: LiteLLM и Reddit
- Музыка и голос: Suno v5.5 и Lyria 3 Pro
- Железо и инфраструктура: Flash-MoE на MacBook
- Геополитика ИИ: Manus, Пентагон, GLM 5.1
- Инструменты для исследований: Feynman и neuraldeep.ru
- Итог недели
- FAQ
1. OpenAI: конец Sora, Codex-плагины и реклама за $60 CPM
Sora закрывается — Disney уходит
OpenAI объявила о закрытии Sora как самостоятельного продукта: приложение, сайт и API прекращают работу. Параллельно Disney отменила партнёрство и инвестицию объёмом $1 млрд. Это один из крупнейших публичных провалов видеогенерации — продукт, который год назад казался революцией в контентном производстве, не смог найти устойчивую аудиторию.
Причины — скорее всего комплексные: высокая стоимость генерации, непредсказуемое качество для профессиональных задач и нарастающая конкуренция со стороны Runway, Kling и Pika. Disney, вероятно, оценила риски и предпочла не делать ставку на единственного поставщика.
Codex: 1,6 млн пользователей в неделю и 20+ плагинов
OpenAI Codex набрал 1,6 млн WAU и запустил маркетплейс плагинов с 20+ интеграциями: Slack, Figma, Notion, Gmail. Это меняет Codex из инструмента для написания кода в полноценную точку оркестрации рабочих процессов.
Spud: OpenAI завершила претрейн следующей флагманской модели
По данным The Information, OpenAI завершила претрейн новой мощной модели с кодовым именем Spud. Подробности не раскрываются, но само завершение этапа претрейна — важная точка: дальше файнтюнинг, RLHF и потенциально релиз в горизонте нескольких месяцев.
Реклама в ChatGPT: дорого и без аналитики
По данным The Information, рекламная программа ChatGPT буксует: CPM держится на отметке $60 — в 3 раза дороже Meta. При этом нет нормальной системы аналитики и высокий порог входа для рекламодателей. Потенциал огромный (аудитория ChatGPT — сотни миллионов), но монетизация через рекламу пока не взлетела.
2. Anthropic: утечка Claude Mythos, победа в суде и computer use на Mac
Claude Mythos (кодовое имя: Capybara)
Fortune сообщила об утечке данных о следующей флагманской модели Anthropic — Claude Mythos с кодовым именем Capybara. По просочившимся данным, модель значительно превосходит Claude Opus по возможностям, особенно в кодинге и кибербезопасности. Сама Anthropic подтвердила факт утечки, охарактеризовав модель как «step-change in capabilities», но деталей не раскрыла.
Это прямой ответ на слухи об OpenAI Spud. Гонка следующего поколения моделей разворачивается быстрее, чем кто-либо ожидал — и теперь о ней знает широкая аудитория.
Победа над Пентагоном
Anthropic выиграла судебный запрет против попытки администрации Трампа ограничить её работу с Министерством обороны. Судья назвала попытку «классической местью» — редкая формулировка для федерального дела. Это важный прецедент: попытки использовать регуляторные механизмы как политический инструмент против AI-компаний теперь будут проходить повышенный правовой контроль.
Claude получил управление компьютером на Mac
Claude Computer Use теперь доступен на macOS: агент управляет приложениями, браузером, мышью и клавиатурой напрямую через интерфейс dispatch. Возможности — от автоматизации рутинных задач до полноценного агентного выполнения многошаговых сценариев без участия человека.
3. Google: Gemini 3.1 Flash Live, TurboQuant и AI-браузер
Gemini 3.1 Flash Live — реальное время для голосовых агентов
Google выпустила Gemini 3.1 Flash Live — realtime мультимодальную модель, оптимизированную для голосовых агентов:
- 90+ языков с нативной обработкой аудио
- В 2 раза длиннее память разговора по сравнению с предыдущей версией
- Низкая задержка, оптимизированная для диалоговых интерфейсов
Это прямой конкурент GPT-4o Realtime и ElevenLabs Conversational AI — рынок голосовых агентов становится одним из самых конкурентных сегментов.
TurboQuant: 6× меньше памяти, 8× быстрее на H100
Google Research опубликовала TurboQuant — технологию квантизации KV-cache до 3 бит:
- 6× сокращение потребления памяти
- До 8× ускорение на GPU NVIDIA H100
- Прямое применение для снижения стоимости инференса больших моделей
Сообщество ответило немедленно: на Reddit появился RotorQuant (на алгебре Клиффорда, в 10–19× быстрее TurboQuant) и sparse V dequant для llama.cpp с приростом +22,8% к скорости декодирования. Open-source снова показал, что корпоративные релизы — это точка старта, а не финиша.
AI-браузер в Google AI Studio
Google показала экспериментальный AI-браузер в AI Studio, который не загружает существующие страницы, а генерирует их с нуля на основе запроса. Пока это прототип, но направление очевидно: будущие браузеры могут стать интерфейсами для генерации контента, а не только его потребления.
4. Open-source волна: аудио, агентный поиск, квантизация
Mistral Voxtral TTS — лучше ElevenLabs по оценке людей
Mistral выпустила Voxtral TTS — open-source модель для синтеза речи, которая по оценкам независимых тестировщиков превосходит ElevenLabs. Это серьёзный удар по платным TTS-решениям: Voxtral доступна для локального запуска и коммерческого использования.
Cohere Transcribe — №1 на HuggingFace Open ASR Leaderboard
Cohere выпустила Transcribe — open-source ASR-модель для транскрипции аудио, занявшую первое место на HuggingFace Open ASR Leaderboard. Для русского рынка это особенно интересно: появляется сильная open-source альтернатива коммерческим решениям для распознавания речи.
Chroma Context-1: агентный поиск в 25× дешевле frontier-моделей
Chroma выпустила Context-1 — open-source модель на 20 млрд параметров для агентного поиска:
- Сравнима с frontier-моделями по качеству поиска
- В 10× меньше задержка по сравнению с GPT-4o/Claude
- В 25× дешевле в инференсе
- Лицензия Apache 2.0
Это меняет экономику RAG-приложений: специализированная небольшая модель может работать лучше огромного универсального монстра в конкретной задаче.
5. ARC-AGI-3: люди 100%, модели <1%
Вышел ARC-AGI-3 — новый интерактивный бенчмарк агентного рассуждения. Пропасть колоссальная: люди решают 100% задач, лучшие AI-модели по текущему лидерборду — меньше 1%. Задачи проверяют способность адаптироваться к новым правилам по ходу решения — то, с чем LLM традиционно справляются плохо.
Это напоминание о том, что AGI — всё ещё скорее маркетинговый термин, чем технический факт. Паттерн-матчинг на триллионах токенов не равен рассуждению.
6. Инструменты разработчика: Figma, Claude Code, Cursor, Codex
Figma открыла канвас для AI-агентов через MCP
Figma открыла канвас через MCP-сервер для AI-агентов. Claude Code, Codex, Cursor и другие теперь могут читать и писать прямо на Figma-канвас. Бесплатно на период бета. Это первый крупный дизайн-инструмент с нативной AI-агентной интеграцией — потенциально меняет рабочий процесс дизайнеров так же, как GitHub Copilot изменил разработку.
Claude Code: Auto Mode и Auto-Dream
Anthropic выпустила Claude Code Auto Mode — режим автономного выполнения задач, который безопаснее флага --dangerously-skip-permissions. Sonnet в реальном времени решает, какие действия можно выполнять без подтверждения пользователя.
Параллельно появился auto-dream — механизм консолидации памяти между сессиями. Агент в фоне «переваривает» опыт предыдущих сессий и формирует сжатый контекст для следующей — по аналогии с тем, как человеческий мозг обрабатывает воспоминания во сне.
Cursor: real-time RL и self-hosted агенты
Cursor обучает Composer через real-time RL прямо в продакшне — новые чекпоинты каждые ~5 часов. Это означает, что модель буквально улучшается от использования прямо сейчас, пока вы читаете этот текст.
Дополнительно появился self-hosted режим для облачных агентов Cursor — для компаний, которым важна изоляция данных и запуск в собственной инфраструктуре.
7. ChatGPT Library: 10 ГБ облака и память о файлах
OpenAI запустила ChatGPT Library — облачное хранилище файлов объёмом до 10 ГБ с интеграцией в память. Теперь ChatGPT может «помнить» содержимое загруженных файлов между разными чатами: загрузил отчёт один раз — ссылаться на него можно в любом последующем разговоре.
Это качественно меняет сценарий использования ChatGPT для работы с документами: больше не нужно каждый раз заново прикладывать файл к сообщению.
8. Безопасность: LiteLLM и Reddit
Supply chain атака на LiteLLM через PyPI
Серьёзный инцидент: LiteLLM (3,4 млн загрузок в день) стал жертвой supply chain атаки через группу TeamPCP. Схема:
- Скомпрометировали security-сканер Trivy
- Получили PyPI-токен
- Залили малварь, крадущую SSH-ключи, cloud-токены и Kubernetes-секреты
Если вы используете LiteLLM — немедленно обновите версию, проверьте логи и смените SSH-ключи и API-токены. Это напоминание о том, что цепочка поставок open-source — уязвимое место, особенно для популярных пакетов в AI-стеке.
Reddit вводит биометрическую верификацию
Reddit объявил о биометрической верификации для подозрительных аккаунтов: passkeys, Face ID и документы. Это ответ на массовое распространение AI-ботов на платформе. Парадокс момента: AI генерирует контент, от которого защищаются биометрией, созданной с помощью AI.
9. Музыка и голос: Suno v5.5 и Lyria 3 Pro
Suno выпустила версию v5.5 с ключевой новой функцией — генерацией музыки клонированным голосом пользователя. Теперь можно буквально написать песню своим голосом, не выходя в студию.
Google обновила Lyria 3 Pro — теперь модель генерирует треки продолжительностью до 3 минут. Предыдущее ограничение в 30–60 секунд было главным практическим барьером для использования в реальных проектах.
Аудио-AI ускоряется: то, что год назад казалось фантастикой, стало рядовой функцией.
10. Железо и инфраструктура: Flash-MoE на MacBook
Вышел Flash-MoE — инференс-движок на C/Metal, который позволяет стримить 397B MoE-модель прямо с SSD на MacBook с 48 ГБ RAM со скоростью 5,5 токенов/сек.
Для задач, не требующих мгновенного ответа — анализ документов, batch-обработка, ночные пайплайны — это открывает новые возможности локального запуска огромных моделей без серверной инфраструктуры. Год назад это было из области фантастики.
11. Геополитика ИИ: Manus, Пентагон, GLM 5.1
Китай задержал сооснователей Manus
Китай задержал сооснователей стартапа Manus — компании, которую Meta планировала купить за $2 млрд. Официальная причина не раскрыта, но контекст очевиден: Пекин обеспокоен оттоком AI-компаний в западные юрисдикции. Manus уже перенёс юридическое лицо в Сингапур. Это сигнал всем китайским AI-стартапам, рассматривающим продажу западным покупателям.
Пентагон: бюджет Palantir Maven вырос с $480 млн до $13 млрд
Министерство обороны США формализовало Palantir Maven AI как базовую военную систему. Бюджет вырос с $480 млн в 2024 году до $13 млрд — рост в 27 раз за два года. Военное применение AI перешло из экспериментальной фазы в операционную.
GLM 5.1: 94,6% от Claude Opus 4.6 в кодинге
Вышла GLM 5.1 — модель набирает 94,6% от результатов Claude Opus 4.6 в ряде кодинг-бенчмарков. Разрыв между западными и китайскими моделями продолжает сокращаться — и это не только конкуренция компаний, но и вопрос технологического суверенитета.
12. Инструменты для исследований: Feynman и neuraldeep.ru
Feynman — новый open-source AI-агент для научного ресерча, запускаемый прямо из командной строки. Заточен под работу с академическими источниками, поиск по базам данных и синтез информации из множества статей.
neuraldeep.ru — агрегатор русскоязычных skills, MCP и CLI-инструментов для AI-разработчиков. Удобная точка входа для тех, кто работает на русском рынке и ищет готовые интеграции. Telegram: @neuraldeep.
Итог недели
Три сквозных тренда:
1. Следующее поколение моделей выходит из тени. Claude Mythos, OpenAI Spud, GLM 5.1 — все они либо утекли, либо заявили о себе именно на этой неделе. Следующие 3–6 месяцев будут определяющими для расстановки сил.
2. Open-source закрывает разрыв быстрее, чем ожидалось. Voxtral TTS обходит ElevenLabs, Context-1 конкурирует с frontier при 25× меньшей стоимости, RotorQuant превосходит Google TurboQuant в 10–19 раз. Корпоративные монополии на качество заканчиваются.
3. AI встраивается в инфраструктуру. Figma + MCP, Cursor real-time RL, Codex-плагины, Claude Computer Use, ChatGPT Library — AI перестаёт быть отдельным инструментом и становится слоем внутри привычных рабочих сред.
Часто задаваемые вопросы
Почему OpenAI закрыла Sora? Официальных причин нет, но высокая стоимость инфраструктуры, низкое удержание пользователей и отказ Disney от инвестиции в $1 млрд делают продолжение нецелесообразным. Функциональность видеогенерации, по всей видимости, будет интегрирована в другие продукты OpenAI.
Что такое Claude Mythos и когда его ждать? Claude Mythos (кодовое имя Capybara) — следующая флагманская модель Anthropic. По просочившимся данным, значительно превосходит Claude Opus, особенно в кодинге и кибербезопасности. Дата релиза официально не объявлена.
Что такое ARC-AGI-3 и почему важна пропасть между людьми и моделями? ARC-AGI-3 — бенчмарк агентного рассуждения, где люди решают 100% задач, а лучшие AI-модели — менее 1%. Это демонстрирует, что текущие LLM хороши в паттерн-матчинге, но плохо справляются с задачами, требующими подлинной адаптации к новым правилам.
Безопасно ли использовать LiteLLM после атаки? Обновите LiteLLM до последней версии, проверьте логи на предмет подозрительной активности, смените SSH-ключи и API-токены, если пакет использовался в производственной среде до патча.
Что значит открытие Figma-канваса для AI-агентов? Через MCP-сервер Claude Code, Codex или Cursor теперь могут напрямую читать и модифицировать Figma-дизайны. Это открывает путь к автоматической генерации UI, синхронизации кода и дизайна и агентному прототипированию — без ручного экспорта и копирования.
Что такое Claude Code auto-dream? Механизм консолидации памяти: агент в фоне обрабатывает опыт предыдущих сессий и формирует сжатый контекст для следующей. Похоже на то, как мозг обрабатывает воспоминания во время сна — отсюда и название.
*Следите за следующим дайджестом — гонка только ускоряется.*