軽量化:品質を犠牲にせずにLLMを22%圧縮した方法
2026-04-17
Cloudflareのネットワーク全体でLLMを実行するには、GPUメモリ帯域幅についてよりスマートで効率的になる必要があります。そこで当社は、最高22%のモデルフットプリント削減を実現するロスレスな推論時間圧縮システムUnweightを開発しました。これにより、かつてないほど高速かつ安価な推論を提供できるようになりました。...

2026-04-17
Cloudflareのネットワーク全体でLLMを実行するには、GPUメモリ帯域幅についてよりスマートで効率的になる必要があります。そこで当社は、最高22%のモデルフットプリント削減を実現するロスレスな推論時間圧縮システムUnweightを開発しました。これにより、かつてないほど高速かつ安価な推論を提供できるようになりました。...
2025-10-27
ACMのInternet Measurement Conferenceに合わせて、Cloudflare Researchチームは今週、より測定可能で回復力があり透明性の高いインターネットの構築に関する調査結果をお伝えする一連の記事を公表しています。これらの記事では、インターネットの測定、インターネットの耐障害性、暗号化、ネットワーキングにおける基本的概念を取り上げる予定です。 ...
2025-08-27
Infireは、リソース使用率を最大化するためにさまざまなテクニックを採用したLLM推論エンジンで、Cloudflareのワークロードにおいて優れたパフォーマンスで、より効率的にAIモデルを提供できるようにします。...
2023-09-28
Microsoft EdgeがCloudflareのプライバシースタックの主要部分であるCloudflareのプライバシープロキシ技術を活用してEdge Secure ネットワーク機能を実現した内容についてお知らせします。この統合により、Microsoft Edgeを選択したユーザーは、Webサイト間で追跡されることなく、よりプライベートにインターネットを閲覧できるようになります...
2022-10-27
Privacy Gatewayは、プライバシーフォワードのアプリケーションがCloudflareを信頼できるリレーとして使用し、IPアドレスを含む識別情報をインフラストラクチャに表示することを制限することができます...
2022-03-10
本日皆様に提供できるのは、WhatsAppと提携し、Web上のWhatsAppにアクセスした際に実行されるコードがWhatsAppの意図したコードであることをユーザーに保証するシステムであり、この発表ができることを嬉しく思います...