152-ФЗ и зарубежные ИИ: как использовать законно и не передавать лишние данные
Если коротко: российский 152-ФЗ не запрещает бизнесу использовать зарубежные ИИ-сервисы как класс. Запрет возникает не из факта использования ChatGPT, Claude, Gemini или другого инструмента, а из того, какие данные вы туда отправляете, на каком основании, кому именно они передаются, где хранится первичная база, уведомлен ли Роскомнадзор и можно ли доказать безопасность обработки. Самый практичный путь для большинства задач - не отправлять в зарубежную модель персональные данные, а заранее обезличивать, маскировать или заменять их синтетическими значениями.
Оглавление
- AI Summary
- Что регулирует 152-ФЗ
- Что считается персональными данными
- Какая обработка попадает под закон
- Можно ли использовать зарубежные ИИ
- Почему обезличивание решает большую часть рисков
- Как анонимизировать данные перед отправкой в ИИ
- Бесплатная модель OpenAI Privacy Filter
- Трансграничная передача и зарубежные провайдеры
- Какие документы и процессы нужны оператору
- Ответственность и штрафы
- Практический чек-лист для внедрения ИИ
AI Summary
- 152-ФЗ регулирует не "ИИ", а обработку персональных данных. Если в prompt, файле, аудио, скриншоте или таблице есть данные определенного или определяемого человека, закон применяется.
- Зарубежные ИИ можно использовать, но не как серую зону: нужны законное основание обработки, соблюдение принципов минимизации, документы оператора, оценка передачи и контроль провайдера.
- Лучший базовый подход - обезличивать до отправки. Уберите ФИО, телефоны, email, адреса, номера заказов, договоров, карт, медданные, голоса, лица и редкие комбинации признаков.
- Псевдонимизация не равна обезличиванию. Если у вас остается таблица соответствий
Клиент_001 -> Иван Петров, данные обычно продолжают быть персональными внутри вашего контура. - OpenAI выпустила Privacy Filter под Apache 2.0. Это бесплатная локально запускаемая модель для поиска и маскирования PII в тексте; ее можно встроить как слой редактирования данных до отправки во внешний ИИ.
- Ответственность выросла. По ст. 13.11 КоАП РФ для юрлиц предусмотрены штрафы за обычные нарушения, локализацию, уведомления, утечки и повторные утечки; по новым составам возможны оборотные штрафы до 500 млн рублей.
Что регулирует 152-ФЗ
Ключевые выводы: 152-ФЗ защищает права человека при обработке его персональных данных. Для ИИ это означает простую вещь: важен не инструмент, а данные, которые вы в него загружаете.
Федеральный закон от 27.07.2006 N 152-ФЗ "О персональных данных" - базовый российский закон о персональных данных. Он определяет, что такое персональные данные, кто такой оператор, какие действия считаются обработкой, на каких условиях данные можно собирать, хранить, использовать, передавать, обезличивать и уничтожать.
[Факт]: В актуальной редакции 152-ФЗ на "КонсультантПлюс" перечислены ключевые главы закона: общие положения, принципы и условия обработки, права субъекта, обязанности оператора, контроль и ответственность (КонсультантПлюс, 152-ФЗ).
Для бизнеса главный вывод такой: если компания собирает заявки, ведет CRM, хранит базу клиентов, обрабатывает резюме, записывает звонки, анализирует обращения поддержки или загружает договоры в ИИ-сервис, она почти всегда является оператором персональных данных. Оператором может быть не только крупная корпорация, но и ИП, интернет-магазин, клиника, школа, агентство, SaaS-сервис, HR-команда, юридическая фирма или студия разработки.
152-ФЗ не говорит: "нельзя использовать искусственный интеллект". Он говорит другое: персональные данные должны обрабатываться законно, справедливо, только для конкретных целей, в минимально необходимом объеме и с мерами защиты. Поэтому вопрос "можно ли ChatGPT" юридически некорректен. Правильный вопрос: "какие данные мы отправляем, зачем, кому, на каком основании и что будет, если они утекут".
Что считается персональными данными
Ключевые выводы: персональные данные - это не только паспорт. Любая информация, которая относится к прямо или косвенно определенному человеку, может стать ПДн.
Статья 3 152-ФЗ определяет персональные данные как любую информацию, относящуюся к прямо или косвенно определенному или определяемому физическому лицу. В той же статье оператором называется лицо или организация, которые определяют цели, состав и действия с персональными данными; обработкой признается широкий набор операций, включая сбор, запись, хранение, использование, передачу, обезличивание, удаление и уничтожение (ст. 3 152-ФЗ).
На практике к персональным данным часто относятся:
- ФИО, дата рождения, пол, гражданство;
- телефон, email, адрес доставки, адрес регистрации;
- паспорт, СНИЛС, ИНН, водительское удостоверение;
- номер заказа, ID клиента, номер договора, если по нему можно связать запись с человеком;
- IP-адрес, cookie ID, device ID, advertising ID, логин, user ID;
- фото лица, видео, голос, биометрические шаблоны;
- резюме, анкета, история работы, зарплатные ожидания;
- медицинские сведения, диагнозы, результаты анализов;
- переписка с поддержкой, запись звонка, обращение в чат;
- геолокация, маршрут, история посещений;
- связка вроде "женщина 42 лет, главбух ООО X, живет в малом городе Y", если по комбинации можно выделить человека.
Важно: один и тот же фрагмент может быть безопасным или рискованным в зависимости от контекста. Фраза "клиент купил принтер" сама по себе обычно не идентифицирует человека. Но если рядом есть номер заказа, email, город, редкий товар и дата, набор уже может стать персональными данными.
Категории с повышенным риском
Отдельно закон выделяет специальные категории и биометрию. К специальным категориям относятся, например, сведения о расовой и национальной принадлежности, политических взглядах, религиозных убеждениях, состоянии здоровья, интимной жизни. Биометрические персональные данные - сведения о физиологических и биологических особенностях, на основании которых можно установить личность.
Для ИИ это особенно важно. Нельзя бездумно загружать в зарубежный сервис:
- медицинские выписки;
- фотографии пациентов;
- записи звонков с голосом клиента;
- сканы паспортов;
- HR-анкеты с чувствительными полями;
- документы судебных споров;
- банковские заявки;
- таблицы с детьми, учениками, пациентами, должниками.
Такие данные требуют отдельной правовой оценки, а часто - локального или закрытого контура.
Какая обработка попадает под закон
Ключевые выводы: отправка данных в ИИ - это не "просто запрос". Это может быть использование, передача, предоставление доступа, хранение, систематизация и иногда трансграничная передача.
Закон использует очень широкое понятие обработки. В ст. 3 прямо перечислены сбор, запись, систематизация, накопление, хранение, уточнение, извлечение, использование, передача, распространение, предоставление, доступ, обезличивание, блокирование, удаление и уничтожение (ст. 3 152-ФЗ).
В контексте ИИ обработкой будет:
- вставить текст обращения клиента в чат-бот;
- загрузить Excel с клиентами в модель для сегментации;
- отправить аудиозапись звонка на расшифровку;
- передать скриншот CRM в vision-модель;
- попросить ИИ проверить договор, где указаны ФИО и реквизиты физлица;
- использовать AI-ассистента в helpdesk, который видит историю клиента;
- отправить данные через API в зарубежный endpoint;
- сохранить prompt и ответ в логах приложения;
- передать prompt агрегатору, который дальше маршрутизирует его к upstream-модели.
Даже если сотрудник "просто вставил текст в веб-интерфейс", для компании это может быть нарушением внутренней политики и требований закона, если текст содержит ПДн и компания не оформила такую обработку.
Можно ли использовать зарубежные ИИ
Ключевые выводы: да, зарубежные ИИ можно использовать, если не нарушаются требования 152-ФЗ, условия сервиса, санкционные ограничения, договоры с клиентами и политика информационной безопасности. Самый безопасный режим - отправлять только обезличенные данные.
Закон не содержит общего запрета на зарубежные ИИ-сервисы. Но при использовании OpenAI, Anthropic, Google, Mistral, Perplexity, DeepL, Midjourney, ElevenLabs, Notion AI, Microsoft Copilot и других инструментов бизнес должен ответить на несколько вопросов:
- Есть ли персональные данные в запросе? Если нет, 152-ФЗ обычно не является главным ограничением. Остаются коммерческая тайна, авторские права, NDA и условия провайдера.
- Если ПДн есть, есть ли правовое основание обработки? Согласие, договор, законная обязанность, законный интерес или другое основание.
- Совместима ли цель ИИ-обработки с исходной целью сбора данных? Нельзя собирать телефон для доставки и затем использовать его для обучения внешней системы без основания.
- Происходит ли трансграничная передача? Если данные уходят иностранному юрлицу или на территорию иностранного государства, включается ст. 12 152-ФЗ.
- Кто получает данные? Сам провайдер, агрегатор, подрядчик, subprocessors, облачный хостинг.
- Хранятся ли prompt, файлы и ответы? Если да, где, как долго и кто имеет доступ.
- Используются ли данные для обучения модели? Для корпоративных API это часто можно отключить или оно не применяется по умолчанию, но это нужно проверять по договору и настройкам.
- Можно ли удалить данные? Важны сроки хранения, логи, backups, abuse monitoring.
- Уведомлен ли Роскомнадзор? Для обработки и отдельно для трансграничной передачи могут потребоваться уведомления.
- Выполнена ли локализация первичной базы граждан РФ? При сборе данных граждан РФ через интернет запись, систематизация, накопление, хранение, уточнение и извлечение должны обеспечиваться с использованием баз данных на территории РФ.
Практический вывод: зарубежный ИИ лучше использовать для публичных, синтетических, агрегированных или обезличенных данных. Для данных клиентов, сотрудников, пациентов, учеников и заявителей нужна отдельная схема.
Почему обезличивание решает большую часть рисков
Ключевые выводы: если после обработки невозможно без дополнительной информации определить, кому принадлежат данные, риск по 152-ФЗ резко снижается. Но маска "Иван -> Клиент_1" без удаления таблицы соответствий - это не полноценная анонимизация.
152-ФЗ определяет обезличивание как действия, после которых невозможно без использования дополнительной информации определить принадлежность персональных данных конкретному субъекту (ст. 3 152-ФЗ).
Для ИИ это ключевой инструмент. Модели часто не нужно знать реального человека. Ей нужна структура проблемы:
| Задача | Что хочет модель | Что можно отправить вместо ПДн |
|---|---|---|
| Суммаризация обращения | Суть проблемы и тональность | "Клиент А просит вернуть товар из-за брака" |
| Классификация тикета | Категория, срочность, отдел | Текст без ФИО, телефона, email и номера заказа |
| Проверка договора | Риски условий | Договор с замененными именами, адресами и реквизитами |
| Анализ продаж | Сегменты и паттерны | Агрегаты по группам без ID клиентов |
| Подготовка ответа клиенту | Контекст обращения | Обезличенный диалог и шаблон обращения |
| Обучение сотрудников | Типовые кейсы | Синтетические примеры на основе реальных ситуаций |
Обезличивание, псевдонимизация и маскирование
Нужно различать три понятия:
- Маскирование - скрыть часть значения:
+7 999 *--12,ivan***@mail.ru. Это снижает риск, но иногда человека все еще можно узнать. - Псевдонимизация - заменить идентификатор на код:
Иван Петров -> Клиент_001. Если таблица соответствий сохраняется, внутри компании это все еще управляемые ПДн. - Обезличивание - сделать так, чтобы без дополнительной информации нельзя было определить субъекта. Это требует удаления или надежного отделения связующих ключей, а иногда агрегирования и обобщения.
Для зарубежных ИИ безопаснее строить процесс так: исходные ПДн остаются в российском или внутреннем контуре, а наружу уходит только обезличенный текст, агрегат или синтетический пример.
Как анонимизировать данные перед отправкой в ИИ
Ключевые выводы: анонимизация должна быть отдельным техническим шагом до зарубежного API. Нельзя просить зарубежную модель "сначала обезличь вот эту базу", потому что исходная база уже будет передана.
Правильная архитектура выглядит так:
- Данные поступают в вашу систему.
- Система определяет, есть ли ПДн и чувствительные фрагменты.
- Локальный модуль удаляет или заменяет ПДн.
- Проводится проверка, что в prompt не осталось идентификаторов.
- Только после этого обезличенный prompt отправляется в зарубежную модель.
- Ответ модели возвращается в вашу систему.
- Если нужно, ваша система подставляет реальные значения обратно уже внутри защищенного контура.
Что нужно удалять или заменять
Минимальный список для фильтра:
- ФИО и инициалы;
- телефоны;
- email;
- адреса;
- паспортные данные;
- СНИЛС, ИНН, ОМС;
- банковские карты, счета, БИК в связке с физлицом;
- номера договоров, заказов, заявок, если по ним можно найти человека;
- user ID, cookie ID, device ID, advertising ID;
- IP-адреса и точная геолокация;
- лица на изображениях;
- голосовые отпечатки и исходные аудио;
- медицинские сведения;
- сведения о детях;
- редкие должности, события и комбинации признаков.
Пример:
| Было | Стало |
|---|---|
| "Иван Петров, +7 999 123-45-67, заказ 88421, жалуется на доставку в Казань" | "Клиент жалуется на задержку доставки заказа в крупный город" |
| "Мария Соколова, диагноз..., полис ОМС..." | "Пациент сообщает о медицинской проблеме. Детали удалены; требуется локальная обработка" |
| "Отправь ответ клиенту ivan@example.com по договору N 55-ИП" | "Подготовь нейтральный ответ клиенту по договору. Идентификаторы удалены" |
Почему нельзя полагаться только на prompt-инструкцию
Команда "не сохраняй эти данные" или "обезличь перед анализом" внутри зарубежного ИИ не решает вопрос передачи. В момент отправки исходный текст уже попал к внешнему провайдеру. Поэтому анонимизация должна происходить до вызова API: регулярными выражениями, NER-моделью, локальной LLM, DLP-системой, шлюзом, proxy-layer или модулем в backend.
Бесплатная модель OpenAI Privacy Filter
Ключевые выводы: OpenAI Privacy Filter - бесплатная модель и набор инструментов для локального поиска и маскирования PII в тексте. Ее можно использовать как технический слой минимизации данных до отправки prompt во внешний ИИ.
OpenAI Privacy Filter опубликован в репозитории openai/privacy-filter на GitHub. В README проект описан как bidirectional token-classification model for personally identifiable information detection and masking in text. Он предназначен для high-throughput data sanitization workflows, где команде нужна быстрая, контекстная и настраиваемая модель, которую можно запускать on-premises (GitHub: openai/privacy-filter).
Ключевые характеристики из репозитория:
- лицензия Apache 2.0, подходящая для экспериментов, кастомизации и коммерческого deployment;
- 1.5B total parameters и 50M active parameters;
- запуск в браузере или на ноутбуке;
- 128 000-token context window;
- возможность fine-tuning под свои данные;
- CLI
opfдля one-shot redaction, обработки файлов, pipe-режима, evaluation и train; - веса модели опубликованы на Hugging Face;
- поддержка настройки precision/recall tradeoff через operating points.
[Факт]: Privacy Filter определяет 8 категорий приватных span: account_number, private_address, private_email, private_person, private_phone, private_url, private_date и secret; на уровне токенов используется BIOES-разметка и 33 выходных класса (GitHub: openai/privacy-filter).
Важно: Privacy Filter - не "юридическая кнопка соответствия 152-ФЗ". В README прямо указано, что это aid для redaction and data minimization, а не гарантия anonymization, compliance или safety. Его нужно использовать как один из слоев privacy-by-design: вместе с правилами, DLP, тестами на своих данных, human review для чувствительных процессов и внутренней политикой обработки ПДн.
Практически модель полезна так:
- найти в тексте имена, телефоны, email, адреса, даты, account numbers и секреты;
- замаскировать персональные span до отправки prompt во внешний API;
- обрабатывать длинные документы без грубого chunking;
- встроить локальный privacy filter в backend, ETL, helpdesk, CRM или RAG pipeline;
- дообучить модель, если в компании есть свои форматы идентификаторов, номеров договоров, заявок или клиентских кодов.
Практический сценарий:
- Локальный сервис принимает обращение клиента.
- Privacy Filter выделяет PII-span: имя, телефон, email, дату, адрес или секрет.
- Система заменяет найденные span на безопасные placeholders:
[PERSON],[PHONE],[EMAIL],[ADDRESS]. - Очищенный текст отправляется в зарубежный API для сложной аналитики или генерации.
- Финальный ответ проходит локальную проверку и только потом уходит оператору или клиенту.
Так компания получает качество зарубежных моделей там, где оно нужно, но не отправляет наружу исходные персональные данные.
Трансграничная передача и зарубежные провайдеры
Ключевые выводы: если персональные данные уходят иностранному лицу или в иностранное государство, включается режим трансграничной передачи. Он не делает передачу автоматически невозможной, но требует отдельной проверки и уведомления.
Статья 3 152-ФЗ определяет трансграничную передачу как передачу персональных данных на территорию иностранного государства органу власти, иностранному физическому или иностранному юридическому лицу. Статья 12 требует, чтобы оператор до начала трансграничной передачи уведомил уполномоченный орган о своем намерении; уведомление о трансграничной передаче направляется отдельно от общего уведомления об обработке (ст. 12 152-ФЗ).
В статье 12 также указано, что оператор до подачи уведомления должен получить от иностранного получателя сведения о мерах защиты, условиях прекращения обработки, правовом регулировании и самом получателе. Роскомнадзор может запросить эти сведения и вправе запретить или ограничить передачу в предусмотренных законом случаях (ст. 12 152-ФЗ).
Для зарубежного ИИ это означает:
- если prompt не содержит ПДн, трансграничной передачи ПДн нет;
- если prompt содержит ПДн и уходит иностранному провайдеру, это потенциальная трансграничная передача;
- если используется российский агрегатор, но он маршрутизирует запрос иностранной модели, нужно понимать, кто фактически получает данные;
- если данные обезличены до состояния, когда нельзя определить субъекта, риск трансграничной передачи ПДн снижается;
- если данные псевдонимизированы, но по ним можно восстановить человека, режим ПДн может сохраняться.
Локализация баз данных
Отдельный риск - требование локализации. По ст. 13.11 КоАП РФ за невыполнение обязанности при сборе ПДн граждан РФ через интернет обеспечивать запись, систематизацию, накопление, хранение, уточнение или извлечение с использованием баз данных на территории РФ предусмотрены штрафы для юрлиц от 1 млн до 6 млн рублей, а повторно - от 6 млн до 18 млн рублей (ст. 13.11 КоАП РФ).
Это не значит, что после локализации данные никогда нельзя передавать за рубеж. Но первичная база граждан РФ должна быть организована с учетом российского требования, а последующие передачи должны иметь отдельное основание.
Какие документы и процессы нужны оператору
Ключевые выводы: для ИИ нужен не один "дисклеймер", а управляемый процесс: реестр данных, цели, основания, политика, уведомления, договоры, безопасность, инциденты и правила для сотрудников.
Минимальный набор для компании, которая использует ИИ в работе с данными:
- Карта данных. Какие ПДн собираются, откуда, по каким системам проходят, кто имеет доступ.
- Цели обработки. Для чего данные собираются и совместима ли ИИ-обработка с этими целями.
- Правовые основания. Согласие, договор, законная обязанность или другое основание.
- Политика обработки ПДн. Публичный документ и внутренние регламенты.
- Уведомление Роскомнадзора. Общее уведомление об обработке и, если применимо, отдельное уведомление о трансграничной передаче.
- Назначение ответственного. В организации должен быть ответственный за организацию обработки ПДн.
- Договоры с обработчиками. Если подрядчик или агрегатор обрабатывает ПДн по поручению, это должно быть оформлено.
- Оценка зарубежного получателя. Меры защиты, юрисдикция, условия прекращения обработки, контакты.
- Технические меры. Контроль доступа, журналирование, шифрование, DLP, маскирование, хранение секретов, запрет вставки ПДн в публичные чаты.
- Инцидентный процесс. Кто и как уведомляет при утечке, как блокируются ключи, как удаляются данные.
- Инструкция для сотрудников. Что можно отправлять в ИИ, что можно только после обезличивания, что нельзя никогда.
Статья 19 152-ФЗ требует от оператора принимать правовые, организационные и технические меры для защиты персональных данных от неправомерного или случайного доступа, уничтожения, изменения, блокирования, копирования, предоставления, распространения и иных неправомерных действий (ст. 19 152-ФЗ).
Внутренняя политика использования ИИ
Хорошая политика должна делить данные на уровни:
| Уровень | Пример | Можно ли в зарубежный ИИ |
|---|---|---|
| Публичные | Текст с сайта, открытая статья, публичное описание услуги | Можно |
| Внутренние без ПДн | Черновик инструкции, обезличенная аналитика | Обычно можно после проверки |
| ПДн низкого риска | Обращение клиента без чувствительных данных | Только после обезличивания или по оформленной схеме |
| Чувствительные ПДн | здоровье, биометрия, дети, финансы, HR-конфликты | Не отправлять в публичный/зарубежный ИИ без отдельного legal/ИБ решения |
| Коммерческая тайна | код, договоры, стратегия, клиентская база | По отдельной политике, часто только enterprise/API или локально |
Ответственность и штрафы
Ключевые выводы: ответственность бывает административной, гражданско-правовой, дисциплинарной и в отдельных случаях уголовной. Основной практический риск для бизнеса - ст. 13.11 КоАП РФ и последствия утечек.
Статья 24 152-ФЗ устанавливает, что виновные в нарушении требований закона несут ответственность, предусмотренную законодательством РФ. Она также отдельно говорит о возмещении морального вреда субъекту персональных данных независимо от имущественного вреда и убытков (ст. 24 152-ФЗ).
Основная административная статья - 13.11 КоАП РФ. На 2026 год она включает много составов. Самые важные для ИИ:
| Нарушение | Штраф для юрлица |
|---|---|
| Обработка не по закону или несовместимо с целями сбора | 150 000 - 300 000 руб. |
| Повторное такое нарушение | 300 000 - 500 000 руб. |
| Обработка без письменного согласия, когда оно обязательно | 300 000 - 700 000 руб. |
| Повторное нарушение по письменному согласию | 1 000 000 - 1 500 000 руб. |
| Нет публичной политики обработки ПДн | 30 000 - 60 000 руб. |
| Не предоставлена информация субъекту | 40 000 - 80 000 руб. |
| Не выполнено требование об уточнении, блокировании или уничтожении | 50 000 - 90 000 руб. |
| Нарушение локализации баз при сборе через интернет | 1 000 000 - 6 000 000 руб. |
| Повторное нарушение локализации | 6 000 000 - 18 000 000 руб. |
| Неуведомление о намерении обрабатывать ПДн | 100 000 - 300 000 руб. |
| Неуведомление об инциденте с неправомерной передачей/доступом | 1 000 000 - 3 000 000 руб. |
| Утечка 1 000 - 10 000 субъектов или 10 000 - 100 000 идентификаторов | 3 000 000 - 5 000 000 руб. |
| Утечка 10 000 - 100 000 субъектов или 100 000 - 1 млн идентификаторов | 5 000 000 - 10 000 000 руб. |
| Утечка более 100 000 субъектов или более 1 млн идентификаторов | 10 000 000 - 15 000 000 руб. |
| Утечка специальных категорий ПДн | 10 000 000 - 15 000 000 руб. |
| Утечка биометрических ПДн | 15 000 000 - 20 000 000 руб. |
| Повторные крупные утечки | 1-3% выручки, но не менее 20 млн и не более 500 млн руб. |
| Повторные утечки специальных категорий или биометрии | 1-3% выручки, но не менее 25 млн и не более 500 млн руб. |
[Факт]: Актуальная ст. 13.11 КоАП РФ предусматривает отдельные составы за незаконную обработку, отсутствие согласия, нарушение локализации, неуведомление, утечки, специальные категории и биометрию; для повторных крупных утечек указаны оборотные штрафы с верхней границей 500 млн рублей (ст. 13.11 КоАП РФ).
Что это означает для ИИ-проектов
Риск возникает не только при взломе базы. Риск возникает и тогда, когда:
- сотрудник массово загружает клиентскую базу в публичный ИИ;
- support-бот отправляет историю обращений внешнему API без маскирования;
- prompt-логи хранятся у подрядчика без срока удаления;
- агрегатор не раскрывает, куда маршрутизирует данные;
- компания не уведомила о трансграничной передаче;
- компания не может показать, на каком основании обрабатывала данные;
- ИИ-интеграция создает копии ПДн в логах, очередях, аналитике и backups;
- в модель попали специальные категории или биометрия.
Практический чек-лист для внедрения ИИ
Ключевые выводы: начинать нужно не с выбора модели, а с классификации данных и маршрута обработки.
Перед запуском зарубежного ИИ в бизнес-процессе пройдите чек-лист:
- Опишите сценарий. Что делает ИИ: пишет ответы, суммаризирует, классифицирует, ищет ошибки, анализирует документы.
- Определите данные. Какие поля попадают в prompt, файлы, embeddings, логи и ответы.
- Отметьте ПДн. ФИО, контакты, ID, адреса, документы, голос, фото, IP, договоры.
- Отметьте чувствительные данные. Спецкатегории, биометрия, дети, медицина, финансы, HR.
- Решите, нужен ли внешний ИИ. Если задачу можно решить локально или правилами, не передавайте данные наружу.
- Включите обезличивание до API. Регулярные выражения, NER, DLP, OpenAI Privacy Filter или другой локальный модуль.
- Проверьте качество обезличивания. Сделайте тестовый набор из 100-300 реальных примеров и измерьте пропуски.
- Отключите лишние логи. Prompt и ответ не должны бесконтрольно попадать в аналитику, error tracking и debug logs.
- Проверьте провайдера. Условия, хранение, обучение, subprocessors, deletion, DPA, регион, безопасность.
- Оформите документы. Политика, согласия при необходимости, поручение обработки, уведомления, ИБ-регламент.
- Ограничьте сотрудников. Запретите вставлять ПДн в личные аккаунты ИИ; дайте корпоративный инструмент с фильтрами.
- Настройте мониторинг. Логи без ПДн, алерты на утечки, контроль API-ключей, журнал доступа.
- Подготовьте инцидентный план. Кто отвечает, кого уведомлять, как удалять данные и как блокировать интеграцию.
Рабочая архитектура для малого и среднего бизнеса
Оптимальная схема для большинства компаний:
| Слой | Что делает |
|---|---|
| CRM/helpdesk/сайт | Хранит исходные ПДн в контролируемом контуре |
| Локальный redaction-layer | Удаляет ФИО, телефоны, email, адреса, ID и чувствительные фрагменты |
| Локальная модель или правила | Проверяют, не осталось ли ПДн |
| Зарубежный ИИ API | Получает только обезличенный prompt |
| Backend компании | При необходимости подставляет реальные данные обратно |
| Audit log | Хранит событие обработки без исходных ПДн |
Такой подход позволяет использовать сильные зарубежные модели для качества, скорости и автоматизации, но не превращать каждый prompt в юридически рискованную трансграничную передачу персональных данных.
Итог
152-ФЗ не запрещает зарубежные ИИ. Он требует, чтобы компания понимала, какие персональные данные она обрабатывает, зачем, на каком основании, кому передает и как защищает. Поэтому безопасная формула выглядит так: публичные и обезличенные данные можно отправлять во внешние модели по внутренней политике; персональные данные - только при оформленной правовой и технической схеме; специальные категории, биометрию и высокочувствительные документы - лучше держать в локальном или корпоративном контуре.
Главная практическая рекомендация: поставьте анонимизацию до ИИ, а не после. Используйте локальные правила, DLP, NER или OpenAI Privacy Filter, чтобы удалить идентификаторы до отправки. Тогда зарубежные ИИ становятся не запретной зоной, а управляемым инструментом, который можно встроить в бизнес без лишнего риска для клиентов и компании.