Дайджест ИИ: главные события недели 24–28 марта 2026

ИИ
дайджест
OpenAI
Anthropic
Google
open-source
нейросети
Claude
Cursor
Figma

Дайджест ИИ: главные события недели 24–28 марта 2026

TL;DR: OpenAI закрыла Sora и потеряла Disney. Anthropic выиграла суд у Пентагона и случайно раскрыла данные о Claude Mythos. Google выпустила Gemini 3.1 Flash Live и TurboQuant. Figma открыла канвас для AI-агентов. Reddit вводит биометрическую верификацию. Mistral и Cohere выпустили open-source аудио-модели. ChatGPT получил облачное хранилище. Claude Code — auto mode и auto-dream. Cursor учится в реальном времени. И ещё 15+ событий — всё в одном дайджесте.

Неделя выдалась одной из самых насыщенных в этом году: гонка следующего поколения моделей вышла из тени через утечки и слухи, open-source сообщество дало ответ корпоративным разработкам, а несколько крупных игроков пересмотрели стратегии. Разберём всё по порядку — ни одной новости не пропустим.


Содержание

  1. OpenAI: конец Sora, Codex-плагины и реклама за $60 CPM
  2. Anthropic: утечка Claude Mythos, победа в суде и computer use на Mac
  3. Google: Gemini 3.1 Flash Live, TurboQuant и AI-браузер
  4. Open-source волна: аудио, агентный поиск, квантизация
  5. ARC-AGI-3: люди 100%, модели <1%
  6. Инструменты разработчика: Figma, Claude Code, Cursor, Codex
  7. ChatGPT Library: 10 ГБ облака и память о файлах
  8. Безопасность: LiteLLM и Reddit
  9. Музыка и голос: Suno v5.5 и Lyria 3 Pro
  10. Железо и инфраструктура: Flash-MoE на MacBook
  11. Геополитика ИИ: Manus, Пентагон, GLM 5.1
  12. Инструменты для исследований: Feynman и neuraldeep.ru
  13. Итог недели
  14. FAQ

1. OpenAI: конец Sora, Codex-плагины и реклама за $60 CPM

Sora закрывается — Disney уходит

OpenAI объявила о закрытии Sora как самостоятельного продукта: приложение, сайт и API прекращают работу. Параллельно Disney отменила партнёрство и инвестицию объёмом $1 млрд. Это один из крупнейших публичных провалов видеогенерации — продукт, который год назад казался революцией в контентном производстве, не смог найти устойчивую аудиторию.

Причины — скорее всего комплексные: высокая стоимость генерации, непредсказуемое качество для профессиональных задач и нарастающая конкуренция со стороны Runway, Kling и Pika. Disney, вероятно, оценила риски и предпочла не делать ставку на единственного поставщика.

Codex: 1,6 млн пользователей в неделю и 20+ плагинов

OpenAI Codex набрал 1,6 млн WAU и запустил маркетплейс плагинов с 20+ интеграциями: Slack, Figma, Notion, Gmail. Это меняет Codex из инструмента для написания кода в полноценную точку оркестрации рабочих процессов.

Spud: OpenAI завершила претрейн следующей флагманской модели

По данным The Information, OpenAI завершила претрейн новой мощной модели с кодовым именем Spud. Подробности не раскрываются, но само завершение этапа претрейна — важная точка: дальше файнтюнинг, RLHF и потенциально релиз в горизонте нескольких месяцев.

Реклама в ChatGPT: дорого и без аналитики

По данным The Information, рекламная программа ChatGPT буксует: CPM держится на отметке $60 — в 3 раза дороже Meta. При этом нет нормальной системы аналитики и высокий порог входа для рекламодателей. Потенциал огромный (аудитория ChatGPT — сотни миллионов), но монетизация через рекламу пока не взлетела.


2. Anthropic: утечка Claude Mythos, победа в суде и computer use на Mac

Claude Mythos (кодовое имя: Capybara)

Fortune сообщила об утечке данных о следующей флагманской модели Anthropic — Claude Mythos с кодовым именем Capybara. По просочившимся данным, модель значительно превосходит Claude Opus по возможностям, особенно в кодинге и кибербезопасности. Сама Anthropic подтвердила факт утечки, охарактеризовав модель как «step-change in capabilities», но деталей не раскрыла.

Это прямой ответ на слухи об OpenAI Spud. Гонка следующего поколения моделей разворачивается быстрее, чем кто-либо ожидал — и теперь о ней знает широкая аудитория.

Победа над Пентагоном

Anthropic выиграла судебный запрет против попытки администрации Трампа ограничить её работу с Министерством обороны. Судья назвала попытку «классической местью» — редкая формулировка для федерального дела. Это важный прецедент: попытки использовать регуляторные механизмы как политический инструмент против AI-компаний теперь будут проходить повышенный правовой контроль.

Claude получил управление компьютером на Mac

Claude Computer Use теперь доступен на macOS: агент управляет приложениями, браузером, мышью и клавиатурой напрямую через интерфейс dispatch. Возможности — от автоматизации рутинных задач до полноценного агентного выполнения многошаговых сценариев без участия человека.


3. Google: Gemini 3.1 Flash Live, TurboQuant и AI-браузер

Gemini 3.1 Flash Live — реальное время для голосовых агентов

Google выпустила Gemini 3.1 Flash Live — realtime мультимодальную модель, оптимизированную для голосовых агентов:

  • 90+ языков с нативной обработкой аудио
  • В 2 раза длиннее память разговора по сравнению с предыдущей версией
  • Низкая задержка, оптимизированная для диалоговых интерфейсов

Это прямой конкурент GPT-4o Realtime и ElevenLabs Conversational AI — рынок голосовых агентов становится одним из самых конкурентных сегментов.

TurboQuant: 6× меньше памяти, 8× быстрее на H100

Google Research опубликовала TurboQuant — технологию квантизации KV-cache до 3 бит:

  • 6× сокращение потребления памяти
  • До 8× ускорение на GPU NVIDIA H100
  • Прямое применение для снижения стоимости инференса больших моделей

Сообщество ответило немедленно: на Reddit появился RotorQuant (на алгебре Клиффорда, в 10–19× быстрее TurboQuant) и sparse V dequant для llama.cpp с приростом +22,8% к скорости декодирования. Open-source снова показал, что корпоративные релизы — это точка старта, а не финиша.

AI-браузер в Google AI Studio

Google показала экспериментальный AI-браузер в AI Studio, который не загружает существующие страницы, а генерирует их с нуля на основе запроса. Пока это прототип, но направление очевидно: будущие браузеры могут стать интерфейсами для генерации контента, а не только его потребления.


4. Open-source волна: аудио, агентный поиск, квантизация

Mistral Voxtral TTS — лучше ElevenLabs по оценке людей

Mistral выпустила Voxtral TTS — open-source модель для синтеза речи, которая по оценкам независимых тестировщиков превосходит ElevenLabs. Это серьёзный удар по платным TTS-решениям: Voxtral доступна для локального запуска и коммерческого использования.

Cohere Transcribe — №1 на HuggingFace Open ASR Leaderboard

Cohere выпустила Transcribe — open-source ASR-модель для транскрипции аудио, занявшую первое место на HuggingFace Open ASR Leaderboard. Для русского рынка это особенно интересно: появляется сильная open-source альтернатива коммерческим решениям для распознавания речи.

Chroma Context-1: агентный поиск в 25× дешевле frontier-моделей

Chroma выпустила Context-1 — open-source модель на 20 млрд параметров для агентного поиска:

  • Сравнима с frontier-моделями по качеству поиска
  • В 10× меньше задержка по сравнению с GPT-4o/Claude
  • В 25× дешевле в инференсе
  • Лицензия Apache 2.0

Это меняет экономику RAG-приложений: специализированная небольшая модель может работать лучше огромного универсального монстра в конкретной задаче.


5. ARC-AGI-3: люди 100%, модели <1%

Вышел ARC-AGI-3 — новый интерактивный бенчмарк агентного рассуждения. Пропасть колоссальная: люди решают 100% задач, лучшие AI-модели по текущему лидербордуменьше 1%. Задачи проверяют способность адаптироваться к новым правилам по ходу решения — то, с чем LLM традиционно справляются плохо.

Это напоминание о том, что AGI — всё ещё скорее маркетинговый термин, чем технический факт. Паттерн-матчинг на триллионах токенов не равен рассуждению.


6. Инструменты разработчика: Figma, Claude Code, Cursor, Codex

Figma открыла канвас для AI-агентов через MCP

Figma открыла канвас через MCP-сервер для AI-агентов. Claude Code, Codex, Cursor и другие теперь могут читать и писать прямо на Figma-канвас. Бесплатно на период бета. Это первый крупный дизайн-инструмент с нативной AI-агентной интеграцией — потенциально меняет рабочий процесс дизайнеров так же, как GitHub Copilot изменил разработку.

Claude Code: Auto Mode и Auto-Dream

Anthropic выпустила Claude Code Auto Mode — режим автономного выполнения задач, который безопаснее флага --dangerously-skip-permissions. Sonnet в реальном времени решает, какие действия можно выполнять без подтверждения пользователя.

Параллельно появился auto-dream — механизм консолидации памяти между сессиями. Агент в фоне «переваривает» опыт предыдущих сессий и формирует сжатый контекст для следующей — по аналогии с тем, как человеческий мозг обрабатывает воспоминания во сне.

Cursor: real-time RL и self-hosted агенты

Cursor обучает Composer через real-time RL прямо в продакшне — новые чекпоинты каждые ~5 часов. Это означает, что модель буквально улучшается от использования прямо сейчас, пока вы читаете этот текст.

Дополнительно появился self-hosted режим для облачных агентов Cursor — для компаний, которым важна изоляция данных и запуск в собственной инфраструктуре.


7. ChatGPT Library: 10 ГБ облака и память о файлах

OpenAI запустила ChatGPT Library — облачное хранилище файлов объёмом до 10 ГБ с интеграцией в память. Теперь ChatGPT может «помнить» содержимое загруженных файлов между разными чатами: загрузил отчёт один раз — ссылаться на него можно в любом последующем разговоре.

Это качественно меняет сценарий использования ChatGPT для работы с документами: больше не нужно каждый раз заново прикладывать файл к сообщению.


8. Безопасность: LiteLLM и Reddit

Supply chain атака на LiteLLM через PyPI

Серьёзный инцидент: LiteLLM (3,4 млн загрузок в день) стал жертвой supply chain атаки через группу TeamPCP. Схема:

  1. Скомпрометировали security-сканер Trivy
  2. Получили PyPI-токен
  3. Залили малварь, крадущую SSH-ключи, cloud-токены и Kubernetes-секреты

Если вы используете LiteLLM — немедленно обновите версию, проверьте логи и смените SSH-ключи и API-токены. Это напоминание о том, что цепочка поставок open-source — уязвимое место, особенно для популярных пакетов в AI-стеке.

Reddit вводит биометрическую верификацию

Reddit объявил о биометрической верификации для подозрительных аккаунтов: passkeys, Face ID и документы. Это ответ на массовое распространение AI-ботов на платформе. Парадокс момента: AI генерирует контент, от которого защищаются биометрией, созданной с помощью AI.


9. Музыка и голос: Suno v5.5 и Lyria 3 Pro

Suno выпустила версию v5.5 с ключевой новой функцией — генерацией музыки клонированным голосом пользователя. Теперь можно буквально написать песню своим голосом, не выходя в студию.

Google обновила Lyria 3 Pro — теперь модель генерирует треки продолжительностью до 3 минут. Предыдущее ограничение в 30–60 секунд было главным практическим барьером для использования в реальных проектах.

Аудио-AI ускоряется: то, что год назад казалось фантастикой, стало рядовой функцией.


10. Железо и инфраструктура: Flash-MoE на MacBook

Вышел Flash-MoE — инференс-движок на C/Metal, который позволяет стримить 397B MoE-модель прямо с SSD на MacBook с 48 ГБ RAM со скоростью 5,5 токенов/сек.

Для задач, не требующих мгновенного ответа — анализ документов, batch-обработка, ночные пайплайны — это открывает новые возможности локального запуска огромных моделей без серверной инфраструктуры. Год назад это было из области фантастики.


11. Геополитика ИИ: Manus, Пентагон, GLM 5.1

Китай задержал сооснователей Manus

Китай задержал сооснователей стартапа Manus — компании, которую Meta планировала купить за $2 млрд. Официальная причина не раскрыта, но контекст очевиден: Пекин обеспокоен оттоком AI-компаний в западные юрисдикции. Manus уже перенёс юридическое лицо в Сингапур. Это сигнал всем китайским AI-стартапам, рассматривающим продажу западным покупателям.

Пентагон: бюджет Palantir Maven вырос с $480 млн до $13 млрд

Министерство обороны США формализовало Palantir Maven AI как базовую военную систему. Бюджет вырос с $480 млн в 2024 году до $13 млрд — рост в 27 раз за два года. Военное применение AI перешло из экспериментальной фазы в операционную.

GLM 5.1: 94,6% от Claude Opus 4.6 в кодинге

Вышла GLM 5.1 — модель набирает 94,6% от результатов Claude Opus 4.6 в ряде кодинг-бенчмарков. Разрыв между западными и китайскими моделями продолжает сокращаться — и это не только конкуренция компаний, но и вопрос технологического суверенитета.


12. Инструменты для исследований: Feynman и neuraldeep.ru

Feynman — новый open-source AI-агент для научного ресерча, запускаемый прямо из командной строки. Заточен под работу с академическими источниками, поиск по базам данных и синтез информации из множества статей.

neuraldeep.ru — агрегатор русскоязычных skills, MCP и CLI-инструментов для AI-разработчиков. Удобная точка входа для тех, кто работает на русском рынке и ищет готовые интеграции. Telegram: @neuraldeep.


Итог недели

Три сквозных тренда:

1. Следующее поколение моделей выходит из тени. Claude Mythos, OpenAI Spud, GLM 5.1 — все они либо утекли, либо заявили о себе именно на этой неделе. Следующие 3–6 месяцев будут определяющими для расстановки сил.

2. Open-source закрывает разрыв быстрее, чем ожидалось. Voxtral TTS обходит ElevenLabs, Context-1 конкурирует с frontier при 25× меньшей стоимости, RotorQuant превосходит Google TurboQuant в 10–19 раз. Корпоративные монополии на качество заканчиваются.

3. AI встраивается в инфраструктуру. Figma + MCP, Cursor real-time RL, Codex-плагины, Claude Computer Use, ChatGPT Library — AI перестаёт быть отдельным инструментом и становится слоем внутри привычных рабочих сред.


Часто задаваемые вопросы

Почему OpenAI закрыла Sora? Официальных причин нет, но высокая стоимость инфраструктуры, низкое удержание пользователей и отказ Disney от инвестиции в $1 млрд делают продолжение нецелесообразным. Функциональность видеогенерации, по всей видимости, будет интегрирована в другие продукты OpenAI.

Что такое Claude Mythos и когда его ждать? Claude Mythos (кодовое имя Capybara) — следующая флагманская модель Anthropic. По просочившимся данным, значительно превосходит Claude Opus, особенно в кодинге и кибербезопасности. Дата релиза официально не объявлена.

Что такое ARC-AGI-3 и почему важна пропасть между людьми и моделями? ARC-AGI-3 — бенчмарк агентного рассуждения, где люди решают 100% задач, а лучшие AI-модели — менее 1%. Это демонстрирует, что текущие LLM хороши в паттерн-матчинге, но плохо справляются с задачами, требующими подлинной адаптации к новым правилам.

Безопасно ли использовать LiteLLM после атаки? Обновите LiteLLM до последней версии, проверьте логи на предмет подозрительной активности, смените SSH-ключи и API-токены, если пакет использовался в производственной среде до патча.

Что значит открытие Figma-канваса для AI-агентов? Через MCP-сервер Claude Code, Codex или Cursor теперь могут напрямую читать и модифицировать Figma-дизайны. Это открывает путь к автоматической генерации UI, синхронизации кода и дизайна и агентному прототипированию — без ручного экспорта и копирования.

Что такое Claude Code auto-dream? Механизм консолидации памяти: агент в фоне обрабатывает опыт предыдущих сессий и формирует сжатый контекст для следующей. Похоже на то, как мозг обрабатывает воспоминания во время сна — отсюда и название.


*Следите за следующим дайджестом — гонка только ускоряется.*

← Все статьи

Комментарии (16)

Анна
28 марта 2026, 18:14

Павел, спасибо! Это обнадёживает. Значит для типовых рабочих документов уже работает. Попробую загрузить наш технический гайдлайн — он как раз постоянно нужен в разных чатах.

Максим
28 марта 2026, 18:14

Suno v5.5 с клонированием голоса — это мощно, но сразу вопрос: какие у них ограничения на использование? Потенциал для дипфейков огромный. Надеюсь, у них нормальная верификация что голос принадлежит именно тебе, а не записи чужого человека.

Виктория
28 марта 2026, 18:14

Feynman для научного ресерча из CLI — звучит интересно, но хочется понять как он справляется с русскоязычными источниками. Большинство подобных инструментов заточены под англоязычный академический контент. Кто-то пробовал на русских журналах?

Павел
28 марта 2026, 18:14

Кирилл, Library уже работает у меня в Pro. PDF читает хорошо, но большие файлы (100+ стр) иногда теряет детали при вопросах по середине документа. На коротких — отлично. Главный плюс — больше не нужно каждый раз заново объяснять контекст проекта.

Анна
28 марта 2026, 18:14

Про auto-dream в Claude Code — концепция интересная, но немного жутковатая. Агент «переваривает» сессии пока ты спишь и сам решает что запомнить? Хочется понять, есть ли возможность посмотреть что именно он «запомнил» и при необходимости сбросить.

Кирилл
28 марта 2026, 18:14

ChatGPT Library на 10 ГБ с памятью о файлах между чатами — вот это реально удобно. Сейчас каждый раз прикладываю одни и те же регламенты заново. Жду когда до нас докатится. Кто-нибудь уже попробовал? Работает с PDF нормально или только текстовые форматы?

Евгений
28 марта 2026, 18:08

Flash-MoE на 397B с SSD — звучит фантастически, но 5.5 токенов/сек это очень медленно для диалога. Для batch-обработки или анализа документов — подойдёт. Для реального разговора — нет. Тем не менее сам факт, что такое вообще работает на MacBook, впечатляет. Год назад это было бы из области фантастики.

Ольга
28 марта 2026, 18:08

Manus и Китай — это сигнал всем AI-стартапам, которые думают о продаже западным компаниям. Перенос юрисдикции в Сингапур не защита: при желании давление можно оказать через основателей или инвесторов. Вопрос в том, станет ли это прецедентом или разовой историей.

Никита
28 марта 2026, 18:08

Про ChatGPT Library до 10 ГБ — интересно, но настораживает интеграция с Memory. Получается, OpenAI будет «помнить» содержимое твоих файлов между чатами. Удобно — да, но это уже другой уровень данных, которые они хранят. Кто-нибудь читал условия использования на этот счёт?

Роман
28 марта 2026, 18:08

Алексей, по поводу Sora — скорее всего видеогенерацию затянут в Sora API и выдадут как фичу внутри других продуктов. Так уже было с DALL-E: сначала отдельный продукт, потом просто часть ChatGPT и API. Брендировать отдельно нет смысла, если удержание низкое.

Татьяна
28 марта 2026, 18:07

Про Figma и MCP — применяю Cursor уже месяц. Возможность напрямую работать с канвасом — это не маркетинг, это реально меняет процесс. Сейчас трачу кучу времени на экспорт из Figma → код → обратно. Если агент сможет сам это синхронизировать, это будет настоящая экономия.

Игорь
28 марта 2026, 18:07

ARC-AGI-3: люди 100%, модели <1% — вот это да. Все говорят об AGI, а тут такая пропасть. Хочется понять, что за задачи там — это абстрактные головоломки или что-то более практическое? Если первое, то может это просто специфичный бенчмарк, а не реальный показатель рассуждения.

Светлана
28 марта 2026, 18:07

Раздел про LiteLLM — это важно. У нас в команде пакет использовался в проде. Сразу побежала проверять версию после прочтения. Хорошо, что в дайджесте дали чёткий чеклист: обновить, проверить логи, сменить токены. Большинство подобных статей останавливаются на «была уязвимость», не объясняя что делать.

Денис
28 марта 2026, 18:07

Марина, думаю, это просто разные цели. Google оптимизирует под конкретные задачи и железо, а open-source разработчики берут идею и гонят её в крайность — у них нет ограничений корпоративных стандартов, совместимости с парком клиентов и прочего. Плюс мотивация другая: доказать, что умеют лучше.

Марина
28 марта 2026, 18:07

TurboQuant и RotorQuant в одной новостной волне — это показательно. Google публикует технологию, и через несколько дней open-source сообщество делает в 10-19 раз быстрее. Уже не первый раз такое. Это что, маркетинг или реально корпоративные темпы настолько медленнее?

Алексей
28 марта 2026, 18:07

Про закрытие Sora — не удивлён. Пробовал её для рекламных роликов полгода назад, и качество было нестабильным: один раз отлично, другой — полная каша. Disney явно посчитала риски и не стала ждать. Интересно, куда Sora-технологию встроят — в ChatGPT или в отдельный API для студий?

Оставить комментарий
Регистрация не требуется

Оставьте заявку,
чтобы обсудить проект

Напишите ваш вопрос, не забудьте указать телефон. Мы перезвоним и все расскажем.

Отправляя заявку, вы соглашаетесь с политикой конфиденциальности

Контакты

Москва

Работаем по всей России
и миру (онлайн)

+7 (999) 760-24-41

Ежедневно с 9:00 до 21:00

lamooof@gmail.com

По вопросам сотрудничества

Есть предложение?

Напишите нам в мессенджеры

© 2025 AI студия Владимира Ломтева