AIを活用したコンテキスト分析でデータ損失防止の精度を向上
2025-03-21
CloudflareのData Loss Preventionは、Cloudflareの開発者プラットフォーム上に構築されたシステムで、AIを活用した自己改善型アルゴリズムによって誤検知を減らします。...
\n
しかし、コンテキスト分析の実装も簡単な作業ではありません。簡単な方法は、パターン一致の近くに特定のキーワードがないか調べることです。例えば、マッチングでSSNの可能性があるとされる箇所の近くに「SSN」という言葉がないか探すわけですが、この方法には限界があります。キーワードリストが不完全なことも多く、ユーザーが入力ミスをする可能性もあります。また、識別の鍵となるキーワードが近くに(例:銀行コードの近くに銀行口座、名前の近くにSSNなど)ない真陽性も珍しくありません。
\n当社は、コンテキスト分析の戦略をハードコード化する方法の限界を克服するために、お客様のフィードバックから学習して将来のエクスペリエンスをさらに改善する、動的な自己改善型アルゴリズムを開発しました。お客様からペイロード復号化ログを介して誤検知が報告されると、このシステムが類似コンテキストにおける将来のヒットの信頼度を低下させます。逆に、真陽性の報告があれば、システムが類似コンテキストにおけるヒットの信頼度を高めます。
\nコンテキストの類似性の判断には、Workers AIを活用しています。具体的には、テキストを高次元ベクトル(テキスト埋め込み)に変換する事前トレーニング済み言語モデルを使っています。こうした埋め込みはテキストの意味を把握し、同じ意味だが表現が異なる2つの文が互いに近接するベクトルにマッピングされるようにします。
パターンの一致が検出されると、システムはAIモデルを使用して周辺のコンテキストの埋め込みを計算します。次に、最近傍検索を実行して、以前記録された類義の偽陽性または真陽性を探します。これによって、表現がまったく同じでなくても意味が同じであれば、システムは文脈の類似性を識別することができます。
\nCloudflare従業員のトラフィックを使って実験したところ、このアプローチはそれまで見られなかった新しいパターン一致を効果的に処理しており、その堅牢性が証明されています。DLP管理者がCloudflareのダッシュボードでポリシー一致のペイロードログを見ながら誤検知と真陽性を報告すれば、DLPの継続的改善ができ、時間の経過とともに誤検知が大幅に減っていきます。
\nこの新機能の開発では、Cloudflareの開発者向けプラットフォームであるWorkers AIとVectorizeのコンポーネントを使用しました。基礎となるインフラを自社で管理するのではなく、Cloudflare Workersを基盤として活用し、テキストの埋め込みにはWorkers AIを、ベクターデータベースとしてVectorizeを使用しました。このセットアップにより、基盤となるリソースのプロビジョニングにオーバーヘッドをかけずに、アルゴリズム自体に集中することができます。
Workers AIのおかげで、テキスト埋め込みへの変換が極めて簡単になりました。たった1行のコードで、どんなテキストでも対応するベクトル表現に変換できます。
\nconst result = await env.AI.run(model, {text: [text]}).data;
\n トークン化からGPUによる推論まで、あらゆる処理が可能で、プロセスがシンプルかつスケーラブルになります。
最近傍検索も同様に簡単です。Workers AIからベクトルを取得した後、Vectorizeを使って、過去のレポートから類似コンテキストをすばやく検索します。同時に、現在のパターン一致のベクトルをVectorizeに保存し、将来のフィードバックから学習できるようにします。
リソースの使用を最適化するために、いくつかの巧妙なテクニックを取り入れました。例えば、パターンがヒットしたらそのすべてのベクトルを保存するのではなく、オンラインクラスタリングによってベクトルをクラスターにグループ化し、クラスターの重心だけを、ヒットを追跡するカウンター、レポートとともに保存します。これにより、ストレージの必要性が減り、検索が高速化されます。さらに、Cloudflare Queuesを統合して、インデックス作成プロセスをDLPスキャンのホットパスから分離することで、堅牢で応答性の高いシステムを実現しました。
\nプライバシーは最優先事項です。当社では、一致したテキストはすべて埋め込み変換する前に墨消しし、すべてのベクトルとレポートをVectorize、D1、Workers KVのお客様固有のプライベートな名前空間に保存します。つまり、お客様の学習プロセスはそれぞれ独立しており、セキュアだということです。さらに、データ保持ポリシーを実装し、60日間アクセスも参照もなかったベクトルは当社のシステムから自動的に削除されるようにしています。
\nAIを活用したコンテキスト分析により検出精度が大幅に向上します。ただし、これを行うとエンドユーザーエクスペリエンスに遅延が多少増します。有効化されたDLPエントリのいずれとも一致しないリクエストの場合は、遅延増加はありません。しかし、AIコンテキスト分析が有効になっているプロファイルの有効エントリと一致するリクエストでは、通常約400ミリ秒の遅延増加が発生します。複数のエントリに一致するリクエストなど稀にある極端なケースでは、1.5秒もの遅延増加が起こり得ます。当社は遅延低減に積極的に取り組んでおり、通常で250ミリ秒以内に抑えるのが理想です。
もう1つの制約は、当社の言語モデル選択上、現在の実装は英語しかサポートしていないということです。しかし、Workers AIは、DLPのサポートを他の地域や言語に広げられる多言語モデルを開発中です。
将来的には、AIコンテキスト分析の透明性の向上も目指しています。現在、ユーザーは、過去の誤検知や真陽性の報告に基づいてどのように判定が行われるかについて可視性が得られません。当社では、信頼度スコアの計算方法についてより多くのインサイトを提供し、説明可能性が高くユーザーフレンドリーなシステムにするツールやインターフェースを開発する予定です。
今回のローンチでは、AIコンテキスト分析が利用できるのはGatewayのHTTPトラフィックのみです。2025年末までにはCASBとメールセキュリティの両方で利用可能になり、お客様はデータ環境全体にわたって同じAI機能強化を受けることができます。
\nDLPのAIコンテキスト分析はクローズドベータ版です。こちらから早期アクセス登録して、DLP HTTPトラフィックのマッチの即時改善をご体験ください。一般公開に向けてさらなるアップデートが行われる予定です!
Cloudflare OneからDLPにアクセスする場合は、アカウントマネージャーまでお問い合わせください。
"],"published_at":[0,"2025-03-21T13:00+00:00"],"updated_at":[0,"2025-03-31T08:23:16.732Z"],"feature_image":[0,"https://cf-assets.www.cloudflare.com/zkvhlag99gkb/7k1jqytoKrUA4FF4ivwLvy/ddf9a33f4722a915b9ae51095cfde33a/Feature_Image.png"],"tags":[1,[[0,{"id":[0,"3DmitkNK6euuD5BlhuvOLW"],"name":[0,"Security Week"],"slug":[0,"security-week"]}],[0,{"id":[0,"J61Eszqn98amrYHq4IhTx"],"name":[0,"Zero Trust"],"slug":[0,"zero-trust"]}],[0,{"id":[0,"4yBlHkuMJq9VSFd341CkxY"],"name":[0,"DLP"],"slug":[0,"dlp"]}],[0,{"id":[0,"2UI24t7uddD0CIIUJCu1f4"],"name":[0,"SASE"],"slug":[0,"sase"]}],[0,{"id":[0,"6l7hyMgGAf9GhOz3E7MNxh"],"name":[0,"データ保護"],"slug":[0,"data-protection"]}],[0,{"id":[0,"4Z2oveL0P0AeqGa5lL4Vo1"],"name":[0,"Cloudflare One"],"slug":[0,"cloudflare-one"]}],[0,{"id":[0,"1Wf1Dpb2AFicG44jpRT29y"],"name":[0,"Workers AI"],"slug":[0,"workers-ai"]}]]],"relatedTags":[0],"authors":[1,[[0,{"name":[0,"Warnessa Weaver"],"slug":[0,"warnessa-weaver"],"bio":[0],"profile_image":[0,"https://cf-assets.www.cloudflare.com/zkvhlag99gkb/5MqbUUVujPmYlSKnjtuH7g/285e845343651fb875097ade26346ebf/_tmp_mini_magick20231208-2-1rx6cqm.jpg"],"location":[0],"website":[0],"twitter":[0],"facebook":[0]}],[0,{"name":[0,"Tom Shen"],"slug":[0,"tom-shen"],"bio":[0],"profile_image":[0,"https://cf-assets.www.cloudflare.com/zkvhlag99gkb/e0rSZrw05SKGlLQ3lRzfO/baca2afabcc0fb0cd1f22d9da9cb3770/Tom_Shen.jpg"],"location":[0],"website":[0],"twitter":[0],"facebook":[0]}],[0,{"name":[0,"Joshua Johnson"],"slug":[0,"joshua-johnson"],"bio":[0,null],"profile_image":[0,"https://cf-assets.www.cloudflare.com/zkvhlag99gkb/18NCR3dW2lVfMZmp51xguR/e3cd69751dd3b327c8a98794f4809ca6/joshua-johnson.jpeg"],"location":[0,null],"website":[0,"https://www.linkedin.com/in/joshua-johnson-04418182/"],"twitter":[0,null],"facebook":[0,null]}]]],"meta_description":[0,"Cloudflareのデータ損失防止(DLP)は、Cloudflareの開発者プラットフォーム上に構築した自己改善型AI活用アルゴリズムを用いて、AIでコンテキスト分析することにより検出精度を向上させ、誤検知を減らしています。"],"primary_author":[0,{}],"localeList":[0,{"name":[0,"LOC: Improving Data Loss Prevention accuracy with AI-powered context analysis"],"enUS":[0,"English for Locale"],"zhCN":[0,"Translated for Locale"],"zhHansCN":[0,"No Page for Locale"],"zhTW":[0,"No Page for Locale"],"frFR":[0,"No Page for Locale"],"deDE":[0,"No Page for Locale"],"itIT":[0,"No Page for Locale"],"jaJP":[0,"Translated for Locale"],"koKR":[0,"No Page for Locale"],"ptBR":[0,"No Page for Locale"],"esLA":[0,"No Page for Locale"],"esES":[0,"No Page for Locale"],"enAU":[0,"No Page for Locale"],"enCA":[0,"No Page for Locale"],"enIN":[0,"No Page for Locale"],"enGB":[0,"No Page for Locale"],"idID":[0,"No Page for Locale"],"ruRU":[0,"No Page for Locale"],"svSE":[0,"No Page for Locale"],"viVN":[0,"No Page for Locale"],"plPL":[0,"No Page for Locale"],"arAR":[0,"No Page for Locale"],"nlNL":[0,"No Page for Locale"],"thTH":[0,"No Page for Locale"],"trTR":[0,"No Page for Locale"],"heIL":[0,"No Page for Locale"],"lvLV":[0,"No Page for Locale"],"etEE":[0,"No Page for Locale"],"ltLT":[0,"No Page for Locale"]}],"url":[0,"https://blog.cloudflare.com/improving-data-loss-prevention-accuracy-with-ai-context-analysis"],"metadata":[0,{"title":[0,"AIを活用したコンテキスト分析でデータ損失防止の精度を向上"],"description":[0,"Cloudflareのデータ損失防止(DLP)は、Cloudflareの開発者プラットフォーム上に構築した自己改善型AI活用アルゴリズムを用いて、AIでコンテキスト分析することにより検出精度を向上させ、誤検知を減らしています。"],"imgPreview":[0,"https://cf-assets.www.cloudflare.com/zkvhlag99gkb/3lPS0SwIYd8olZ6LylEllW/e14a79518af9464962710e80ffb24832/OG_Share_2024__25_.png"]}]}],"locale":[0,"ja-jp"],"translations":[0,{"posts.by":[0,"リーク元"],"footer.gdpr":[0,"GDPR"],"lang_blurb1":[0,"この投稿は{lang1}でも表示されます。"],"lang_blurb2":[0,"この投稿は{lang1}および{lang2}でも表示されます。"],"lang_blurb3":[0,"この投稿は{lang1}、{lang2}、{lang3}でも表示されます。"],"footer.press":[0,"プレス"],"header.title":[0,"Cloudflare ブログ"],"search.clear":[0,"消去"],"search.filter":[0,"フィルター"],"search.source":[0,"ソース"],"footer.careers":[0,"キャリア"],"footer.company":[0,"会社"],"footer.support":[0,"サポート"],"footer.the_net":[0,"theNet"],"search.filters":[0,"フィルター"],"footer.our_team":[0,"Cloudflareのチーム"],"footer.webinars":[0,"ウェビナー"],"page.more_posts":[0,"その他の投稿"],"posts.time_read":[0,"{time}分で読了"],"search.language":[0,"言語"],"footer.community":[0,"コミュニティ"],"footer.resources":[0,"リソース"],"footer.solutions":[0,"ソリューション"],"footer.trademark":[0,"商標"],"header.subscribe":[0,"登録"],"footer.compliance":[0,"コンプライアンス"],"footer.free_plans":[0,"Freeプラン"],"footer.impact_ESG":[0,"インパクト/ESG"],"posts.follow_on_X":[0,"Xでフォロー"],"footer.help_center":[0,"ヘルプセンター"],"footer.network_map":[0,"ネットワークマップ"],"header.please_wait":[0,"お待ちください"],"page.related_posts":[0,"関連ブログ投稿"],"search.result_stat":[0,"{search_keyword}の結果{search_range}/{search_total}"],"footer.case_studies":[0,"導入事例"],"footer.connect_2024":[0,"Connect 2024"],"footer.terms_of_use":[0,"利用規約"],"footer.white_papers":[0,"ホワイトペーパー"],"footer.cloudflare_tv":[0,"Cloudflare TV"],"footer.community_hub":[0,"コミュニティハブ"],"footer.compare_plans":[0,"プラン比較"],"footer.contact_sales":[0,"営業担当へのお問い合わせ"],"header.contact_sales":[0,"営業担当へのお問い合わせ"],"header.email_address":[0,"メールアドレス"],"page.error.not_found":[0,"ページが見つかりません"],"footer.developer_docs":[0,"開発者ドキュメント"],"footer.privacy_policy":[0,"プライバシーポリシー"],"footer.request_a_demo":[0,"デモ依頼"],"page.continue_reading":[0,"続きを読む"],"footer.analysts_report":[0,"アナリストレポート"],"footer.for_enterprises":[0,"エンタープライズ向け"],"footer.getting_started":[0,"利用開始"],"footer.learning_center":[0,"ラーニングセンター"],"footer.project_galileo":[0,"プロジェクトGalileo"],"pagination.newer_posts":[0,"次の投稿"],"pagination.older_posts":[0,"以前の投稿"],"posts.social_buttons.x":[0,"Xで議論"],"search.icon_aria_label":[0,"検索"],"search.source_location":[0,"ソース/ロケーション"],"footer.about_cloudflare":[0,"Cloudflareについて"],"footer.athenian_project":[0,"Athenianプロジェクト"],"footer.become_a_partner":[0,"パートナープログラム"],"footer.cloudflare_radar":[0,"Cloudflare Radar"],"footer.network_services":[0,"ネットワークサービス"],"footer.trust_and_safety":[0,"信頼性と安全性"],"header.get_started_free":[0,"まずは無料プランから"],"page.search.placeholder":[0,"Cloudflareを検索"],"footer.cloudflare_status":[0,"Cloudflareステータス"],"footer.cookie_preference":[0,"Cookieの設定"],"header.valid_email_error":[0,"有効なメールアドレスを入力してください。"],"search.result_stat_empty":[0,"検索結果 {search_total}件中{search_range}件を表示"],"footer.connectivity_cloud":[0,"コネクティビティクラウド"],"footer.developer_services":[0,"開発者サービス"],"footer.investor_relations":[0,"IR"],"page.not_found.error_code":[0,"エラーコード:404"],"search.autocomplete_title":[0,"クエリを挿入し、Enterキーを押して送信してください"],"footer.logos_and_press_kit":[0,"ロゴとプレスキット"],"footer.application_services":[0,"アプリケーションサービス"],"footer.get_a_recommendation":[0,"推奨製品"],"posts.social_buttons.reddit":[0,"Redditで議論"],"footer.sse_and_sase_services":[0,"SSEサービスとSASEサービス"],"page.not_found.outdated_link":[0,"古いリンクを使われたか、アドレスを誤って入力された可能性があります。"],"footer.report_security_issues":[0,"セキュリティの問題を報告"],"page.error.error_message_page":[0,"お探しのページは見つかりませんでした。"],"header.subscribe_notifications":[0,"新規投稿のお知らせを受信されたい方は、サブスクリプションをご登録ください:"],"footer.cloudflare_for_campaigns":[0,"Cloudflare for Campaigns"],"header.subscription_confimation":[0,"サブスクリプションが確定されました。ご登録ありがとうございます!"],"posts.social_buttons.hackernews":[0,"Hacker Newsでの議論"],"footer.diversity_equity_inclusion":[0,"多様性、公平性、包摂性"],"footer.critical_infrastructure_defense_project":[0,"重要インフラ防衛プロジェクト"]}]}" ssr="" client="load" opts="{"name":"PostCard","value":true}" await-children="">2025-03-21
CloudflareのData Loss Preventionは、Cloudflareの開発者プラットフォーム上に構築されたシステムで、AIを活用した自己改善型アルゴリズムによって誤検知を減らします。...