GPT-5.4: что умеет новая нейросеть OpenAI и как её использовать

GPT-5.4
OpenAI
искусственный интеллект
ChatGPT
нейросеть
ИИ 2026
GPT-5.4 API

Что такое GPT-5.4 и почему это важно?

GPT-5.4 — новейшая флагманская модель искусственного интеллекта от OpenAI, выпущенная в марте 2026 года. Эта нейросеть объединила в себе лучшие достижения в области рассуждений, программирования и агентных рабочих процессов. Если вы следите за развитием ИИ, GPT-5.4 — это модель, которая меняет стандарты профессиональной работы с искусственным интеллектом.

В этой статье мы разберём ключевые возможности GPT-5.4, сравним её с предыдущими версиями и расскажем, как её использовать уже сегодня.

TL;DR — Ключевые факты о GPT-5.4:
  • Лучшая модель OpenAI для профессиональной работы на 2026 год
  • 83% побед в сравнении с профессионалами на бенчмарке GDPval
  • 75% успешных задач на рабочем столе (OSWorld-Verified) — выше уровня человека (72,4%)
  • Поддержка контекстного окна до 1 млн токенов
  • Снижение галлюцинаций на 33% по сравнению с GPT-5.2

Ключевые возможности GPT-5.4

Профессиональная работа нового уровня

OpenAI разработала GPT-5.4 с акцентом на реальные профессиональные задачи. На бенчмарке GDPval, тестирующем агентов по 44 профессиям из 9 ключевых отраслей экономики США, GPT-5.4 превзошла или сравнялась с профессионалами в 83,0% случаев — против 70,9% у GPT-5.2.

Особый прогресс достигнут в работе с документами офисного типа:

  • Электронные таблицы: на внутреннем бенчмарке аналитика инвестиционного банка GPT-5.4 набирает 87,3% против 68,4% у GPT-5.2
  • Презентации: в 68% случаев люди предпочитали слайды от GPT-5.4 — благодаря лучшей эстетике и визуальному разнообразию
  • Точность данных: ложные утверждения стали встречаться на 33% реже, а полные ответы с ошибками — на 18% реже

Нативное управление компьютером

GPT-5.4 — первая универсальная модель OpenAI с встроенными возможностями computer use. Это означает, что агент может самостоятельно управлять компьютером: нажимать кнопки, вводить текст, навигировать по сайтам и приложениям.

Результаты говорят сами за себя:

  • OSWorld-Verified (навигация по рабочему столу): 75,0% — выше уровня человека (72,4%)
  • WebArena-Verified (работа в браузере): 67,3% успешных задач
  • Online-Mind2Web: 92,8% успешных задач только на основе скриншотов

Для разработчиков это открывает новые горизонты: создание агентов, способных выполнять сложные многоэтапные задачи в реальных программных средах без постоянного вмешательства человека.

Программирование и Codex

GPT-5.4 унаследовала сильнейшие coding-возможности от GPT-5.3-Codex и добавила к ним знания и умения в профессиональной работе. На бенчмарке SWE-Bench Pro она набирает 57,7% — превосходя GPT-5.3-Codex (56,8%) и GPT-5.2 (55,6%).

В Codex появился режим /fast mode, дающий прирост скорости генерации токенов до 1,5× без потери качества. Также выпущен экспериментальный навык Playwright (Interactive), позволяющий Codex визуально отлаживать веб-приложения прямо в процессе их разработки.

Улучшенная работа с инструментами

Одно из ключевых нововведений GPT-5.4 — tool search: вместо того чтобы загружать все определения инструментов в контекст сразу, модель запрашивает их по мере необходимости. Это снижает потребление токенов на 47% при сохранении той же точности.

На бенчмарке BrowseComp, измеряющем способность ИИ-агентов искать труднодоступную информацию в интернете, GPT-5.4 превзошла GPT-5.2 на 17 процентных пунктов: 82,7% против 65,8%. Версия GPT-5.4 Pro устанавливает новый рекорд — 89,3%.

Управляемое мышление в ChatGPT

В ChatGPT GPT-5.4 Thinking теперь отображает предварительный план рассуждений перед тем, как приступить к сложным задачам. Пользователь может скорректировать направление прямо в процессе, не начиная заново. Это особенно полезно для длинных, многоэтапных запросов.

GPT-5.4 vs GPT-5.2: сравнение по ключевым бенчмаркам

БенчмаркGPT-5.4GPT-5.2Прирост
GDPval (профессиональная работа)83,0%70,9%+12,1%
OSWorld-Verified (управление ПК)75,0%47,3%+27,7%
BrowseComp (веб-поиск)82,7%65,8%+16,9%
Toolathlon (использование инструментов)54,6%45,7%+8,9%
ARC-AGI-2 (абстрактное мышление)73,3%52,9%+20,4%

Доступность и цены GPT-5.4

GPT-5.4 доступна уже сегодня:

  • ChatGPT: GPT-5.4 Thinking доступна для подписчиков Plus, Team и Pro (заменяет GPT-5.2 Thinking). GPT-5.2 Thinking будет доступна ещё три месяца в разделе Legacy Models, после чего будет отключена 5 июня 2026 года.
  • API: доступна как gpt-5.4 и gpt-5.4-pro
  • Codex: включает экспериментальную поддержку контекстного окна 1M токенов

Цены на API:

  • gpt-5.4: $2,50 / M входных токенов, $15 / M выходных
  • gpt-5.4-pro: $30 / M входных, $180 / M выходных
  • Batch и Flex — в 2 раза дешевле стандартной цены; Priority processing — в 2 раза дороже

Безопасность и контроль

OpenAI классифицирует GPT-5.4 как модель с высокими кибервозможностями согласно Preparedness Framework. Компания внедрила расширенный стек кибербезопасности: системы мониторинга, контроль доступа и асинхронную блокировку высокорисковых запросов для клиентов с Zero Data Retention.

Важным достижением стало исследование CoT controllability: установлено, что GPT-5.4 Thinking не способна намеренно скрывать ход своих рассуждений, что делает мониторинг цепочки мыслей надёжным инструментом безопасности.

Часто задаваемые вопросы о GPT-5.4

Чем GPT-5.4 отличается от GPT-5.2?

GPT-5.4 значительно превосходит GPT-5.2 по всем ключевым направлениям: профессиональная работа (+12%), управление компьютером (+28%), веб-поиск (+17%). Кроме того, GPT-5.4 — первая модель OpenAI с нативными возможностями computer use и поддержкой контекстного окна до 1 млн токенов.

Можно ли использовать GPT-5.4 бесплатно?

Бесплатного доступа к GPT-5.4 нет. Модель доступна в ChatGPT для подписчиков Plus ($20/мес.), Team и Pro. В API стоимость составляет от $2,50 за миллион входных токенов.

Что такое GPT-5.4 Pro и чем она отличается от обычной GPT-5.4?

GPT-5.4 Pro — версия для максимальной производительности на наиболее сложных задачах. Она доступна в ChatGPT Pro и Enterprise-планах, а также через API. На ряде бенчмарков Pro-версия показывает результаты выше: например, BrowseComp 89,3% против 82,7% у стандартной версии.

Поддерживает ли GPT-5.4 русский язык?

Да, GPT-5.4 поддерживает русский язык. Модель обучена на многоязычных данных и способна выполнять сложные задачи на русском, включая анализ документов, написание текстов и ответы на вопросы.

Когда GPT-5.4 появится в России?

OpenAI доступна в России через VPN или сервисы-посредники, предоставляющие доступ к ChatGPT и API. Официальный доступ из России по-прежнему ограничен политикой компании, однако разработчики могут использовать API через сторонние платформы.

Заключение

GPT-5.4 — это не просто очередная версия языковой модели. Это системный скачок в возможностях ИИ: от работы с документами и кодом до управления компьютером и веб-навигации. OpenAI удалось собрать всё лучшее из недавних разработок в одной модели, сделав её эффективнее, точнее и быстрее.

Если вы разработчик или профессионал, работающий с ИИ-инструментами, GPT-5.4 заслуживает внимания прямо сейчас. Начните с API (gpt-5.4) или попробуйте GPT-5.4 Thinking в ChatGPT — и убедитесь сами, насколько далеко продвинулся искусственный интеллект.

Источники: Официальный анонс OpenAI GPT-5.4 · Бенчмарк GDPval · System Card GPT-5.4

← Все статьи

Комментарии (6)

Екатерина Смирнова
5 марта 2026, 18:39

Фича с preamble в ChatGPT Thinking — очень удобная вещь. Наконец-то можно увидеть, куда модель «собирается» двигаться, и скорректировать на лету. Раньше приходилось переспрашивать заново после длинного ответа не в ту сторону.

Сергей Владимиров
5 марта 2026, 18:39

Снижение галлюцинаций на 33% — на мой взгляд, это самое важное улучшение. Хорошие бенчмарки — это красиво, но когда модель врёт реже, это ощущается в реальной работе. Буду переходить с 5.2.

Наталья Иванова
5 марта 2026, 18:39

Интересно, что OpenAI делает акцент именно на офисных задачах — таблицы, презентации, документы. Наконец-то ИИ ориентируется не только на программистов. 87,3% на задачах аналитика инвестиционного банка — это уже что-то конкретное, а не абстрактные бенчмарки.

Дмитрий Козлов
5 марта 2026, 18:38

Tool search — это то, чего я давно ждал. Когда у тебя 50+ инструментов в MCP-сервере, бесконечные токены на определения бьют по бюджету. Снижение потребления на 47% — очень значимо для продакшена.

Марина Петрова
5 марта 2026, 18:38

Хорошая статья, спасибо! Особенно полезен блок с ценами — сразу видно, что GPT-5.4 подорожала по сравнению с 5.2, но зато и токенная эффективность выросла. Нужно считать реальную стоимость на своих задачах.

Алексей Морозов
5 марта 2026, 18:38

Поразительный скачок в возможностях управления компьютером — 75% на OSWorld выше уровня человека, это просто фантастика. Значит, агенты уже могут работать за нас в реальных приложениях? Не терпится попробовать в связке с Playwright.

Оставить комментарий
Регистрация не требуется

Оставьте заявку,
чтобы обсудить проект

Напишите ваш вопрос, не забудьте указать телефон. Мы перезвоним и все расскажем.

Отправляя заявку, вы соглашаетесь с политикой конфиденциальности

Контакты

Москва

Работаем по всей России
и миру (онлайн)

+7 (999) 760-24-41

Ежедневно с 9:00 до 21:00

lamooof@gmail.com

По вопросам сотрудничества

Есть предложение?

Напишите нам в мессенджеры

© 2025 AI студия Владимира Ломтева