AI Security for Apps теперь в общем доступе

Cloudflare AI Security for Apps обнаруживает и нейтрализует угрозы для приложений на базе ИИ. Сегодня мы объявляем о его выходе в общий доступ

Мы предлагаем новые возможности, такие как обнаружение пользовательских тем, и делаем обнаружение ИИ эндпоинтов бесплатным для всех клиентов Cloudflare, включая пользующихся тарифными планами Free, Pro и Business, чтобы каждый мог видеть, как ИИ развертывается в интернет-приложениях.

Мы также объявляем о расширенном сотрудничестве с IBM, которая выбрала Cloudflare для обеспечения безопасности ИИ своих клиентов, использующих облачные сервисы. Кроме того, мы сотрудничаем с Wiz, чтобы предоставлять совместным клиентам единое представление о состоянии их систем безопасности ИИ.

Новый вид поверхности атаки

Традиционные веб-приложения имеют определенные операции: проверка банковского баланса, выполнение перевода. Вы можете задать детерминированные правила, чтобы обеспечить безопасность таких взаимодействий.

Приложения и агенты на базе ИИ отличаются. Они принимают естественный язык и генерируют непредсказуемые ответы. Нет фиксированного набора операций, которые можно разрешить или запретить, поскольку ввод и вывод являются вероятностными. Злоумышленники могут манипулировать большими языковыми моделями для выполнения несанкционированных действий или утечки конфиденциальных данных. Внедрение промптов, раскрытие конфиденциальной информации и неограниченное использование — вот лишь некоторые из рисков, включенных в рейтинг OWASP Top 10 для приложений больших языковых моделей (LLM).

Эти риски возрастают по мере того, как приложения ИИ становятся агентами. Когда ИИ получает доступ к вызовам инструментов — обработке возвратов, изменении учетных записей, предоставлении скидок или доступа к клиентским данным — один вредоносный промпт становится немедленным инцидентом безопасности.

Клиенты рассказывают нам, с какими трудностями они сталкиваются. «Большинство команд Newfold Digital внедряют свои собственные средства защиты на основе генеративного ИИ, однако все внедряют инновации так быстро, что в конечном итоге неизбежно останутся некоторые пробелы, — говорит Рик Рэдингер, главный системный архитектор Newfold Digital, которая управляет Bluehost, HostGator и Domain.com.

Возможности AI Security for Apps

Для решения этой проблемы мы создали AI Security for Apps. Он находится перед вашими приложениями на базе ИИ, независимо от того, используете ли вы стороннюю модель или размещаете собственную, как часть обратного прокси-сервера Cloudflare. Он помогает вам (1) обнаруживать приложения на основе ИИ в ваших веб-ресурсах, (2) обнаруживать вредоносное поведение или поведение, нарушающее политики, по отношению к этим эндпоинтам и (3) нейтрализовывать угрозы с помощью знакомого конструктора правил WAF.

Discovery — теперь бесплатно для всех

Прежде чем вы сможете защитить свои приложения на базе LLM, вам нужно узнать, где они используются. Мы часто слышим от специалистов по безопасности, что они не имеют полной картины развертывания ИИ в своих приложениях, особенно с учетом того, что рынок больших языковых моделей (LLM) развивается и разработчики меняют модели и поставщиков.

AI Security for Apps автоматически идентифицирует эндпоинты на базе LLM во всех ваших веб-ресурсах, независимо от того, где они размещены и какая модель используется. С сегодняшнего дня эта возможность предоставляется бесплатно для всех клиентов Cloudflare, включая планы Free, Pro и Business.

^{Панель мониторинга Cloudflare с веб-ресурсами, на которой показаны 2 примера эндпоинтов, помеченных как}^cf-llm

Для автоматического обнаружения этих эндпоинтов требуется больше, чем сопоставление общих шаблонов путей, таких как /chat/completions. Многие приложения на основе ИИ не имеют интерфейса чата: например, поиск продуктов, инструменты оценки собственности или системы рекомендаций. Мы создали систему обнаружения, которая проверяет поведение эндпоинтов, а не то, как они называются. Для уверенной идентификации эндпоинтов на базе ИИ требуется достаточный объем действительного трафика.

Обнаруженные эндпоинты на базе ИИ будут видны в разделе Security → Web Assets с пометкой cf-llm. Для клиентов, использующих план Free, обнаружение конечной точки инициируется при первом переходе на страницу Discovery. Для клиентов платного плана обнаружение происходит автоматически в фоновом режиме на регулярной основе. Если ваши эндпоинты на базе ИИ были обнаружены, вы можете немедленно проверить их.

Обнаружение

Обнаружения AI Security for Apps следуют подходу «постоянно включено» для трафика, идущего к вашим эндпоинтам на базе ИИ. Каждый промпт проходит через несколько модулей обнаружения для выявления внедрения промптов, раскрытия персональной идентифицирующей информации, а также конфиденциальных или вредоносных тем. Результаты (независимо от того, был ли запрос вредоносным или нет) прикрепляются в виде метаданных, которые можно использовать в пользовательских правилах WAF для применения политик. Мы постоянно изучаем способы использования нашей глобальной сети, которая обрабатывает трафик примерно с 20 % Интернета, для выявления новых паттернов атак на миллионах сайтов до того, как они достигнут ваших систем.

Новое в общедоступной версии: обнаружение пользовательских тем

Продукт поставляется со встроенными средствами обнаружения распространенных угроз: внедрение промптов, извлечение персональной идентифицирующей информации, а также вредоносные темы. Но у каждой компании есть собственное определение того, что запрещено. Компании, предоставляющей финансовые услуги, может потребоваться обнаружение обсуждений конкретных ценных бумаг. Медицинской компании может потребоваться помечать беседы, затрагивающие данные пациентов. Розничная компания может захотеть узнать, когда клиенты спрашивают о продуктах конкурентов.

Новая функция пользовательских тем позволяет определять эти категории. Вы указываете тему, мы проверяем промпт и выводим оценку актуальности, которую вы можете использовать для журнала, блокировки или обработки — по вашему выбору. Наша цель — создать расширяемый инструмент, который будет адаптироваться к вашим вариантам использования.

^{Оценка актуальности промптов в AI Security for Apps}

Новое в общедоступной версии: извлечение пользовательских промптов

AI Security for Apps устанавливает ограничительные механизмы до того, как небезопасные промпты достигнут вашей инфраструктуры. Чтобы точно выполнять обнаружение и обеспечивать защиту в режиме реального времени, нам сначала необходимо идентифицировать промпт внутри вредоносного трафика запроса. Промпты могут находиться в любом месте в теле запроса, и разные поставщики LLM по-разному структурируют свои API. OpenAI и большинство провайдеров используют $.messages[*].content для завершения сообщений в чате. Пакетный API Anthropic вкладывает промпты в $.requests[*].params.messages[*].content. Ваш собственный инструмент оценки объектов может использовать $.property_description.

Сразу после подключения мы поддерживаем стандартные форматы, используемые OpenAI, Anthropic, Google Gemini, Mistral, Cohere, xAI, DeepSeek и др. Когда мы не можем сопоставить известный шаблон, мы применяем безопасный по умолчанию подход и запускаем обнаружение во всем теле запроса. Это может привести к ложным срабатываниям, когда вредоносный трафик содержит конфиденциальные поля, которые не поступают напрямую в модель ИИ. Например, поле $.customer_name рядом с фактическим промптом может привести к ненужному обнаружению персональной идентифицирующей информации.

Вскоре вы сможете определять собственные выражения JSONPath, чтобы сообщать нам, где именно найти промпт. Это уменьшит количество ложных срабатываний и приведет к более точным обнаружениям. Мы также создаем возможность анализа промптов, которая со временем будет автоматически адаптироваться к структуре вашего приложения.

Нейтрализация

После того как угроза выявлена и оценена, вы можете блокировать ее, вести журнал или доставлять настраиваемые ответы, используя тот же механизм правил WAF, который вы уже используете для остальных средств безопасности вашего приложения. Преимущество общей платформы Cloudflare заключается в том, что вы можете комбинировать сигналы, специфичные для ИИ, со всеми остальными данными о запросе, представленном сотнями полей, доступных в WAF. Попытка внедрения промпта является подозрительной. Совсем другая история — попытка внедрения промпта с IP-адреса, который «прощупывает» вашу страницу входа в систему, использует цифровой отпечаток браузера, связанный с предыдущими атаками, и ротируется через ботнет. Точечные решения, которые видят только уровень ИИ, не могут установить такие связи.

Такой унифицированный уровень безопасности — именно то, что нужно компании Newfold Digital для обнаружения, маркировки и защиты ИИ эндпоинтов, говорит Рэдингер: «Мы с нетерпением ждем возможности использовать его во всех этих проектах в качестве средства отказоустойчивости».

Растущая экосистема

Безопасность ИИ для приложений также будет доступна в рамках растущей экосистемы Cloudflare, в том числе благодаря интеграции с IBM Cloud. Посредством IBM Cloud Internet Services (CIS) конечные пользователи уже могут приобретать передовые решения по безопасности приложений и управлять ими напрямую через учетную запись IBM Cloud.

Мы также сотрудничаем с Wiz, чтобы связать безопасность ИИ для приложений с Wiz AI Security, предоставляя их совместным клиентам единое представление об их уровне безопасности ИИ, от обнаружения моделей и агентов в облаке до защиты прикладного уровня на периферии сети.

Как начать работу

AI Security for Apps теперь доступен для клиентов Cloudflare на плане Enterprise. Свяжитесь с нашими специалистами по работе с клиентами, чтобы начать работу, или оцените продукт в действии с помощью интерактивного ознакомления.

Если у вас есть план Free, Pro или Business, вы можете использовать обнаружение ИИ эндпоинтов уже сегодня. Войдите в свою информационную панель и перейдите в раздел Безопасность → Веб-ресурсы, чтобы просмотреть, какие эндпоинты мы выявили. Следите за новостями — в ближайшее время мы планируем сделать все возможности AI Security for Apps доступными для клиентов на всех тарифах.

Подробнее о настройке см. в нашей документации.

Блог Cloudflare