当社がCloudflareのネットワーク向けに最も効率的な推論エンジンを構築した方法
2025-08-27
Infireは、リソース使用率を最大化するためにさまざまなテクニックを採用したLLM推論エンジンで、Cloudflareのワークロードにおいて優れたパフォーマンスで、より効率的にAIモデルを提供できるようにします。...
2025-08-27
Infireは、リソース使用率を最大化するためにさまざまなテクニックを採用したLLM推論エンジンで、Cloudflareのワークロードにおいて優れたパフォーマンスで、より効率的にAIモデルを提供できるようにします。...
2023-09-26
Sippyを使用して、要求に応じてデータをS3からR2へ段階的に移行し、移行時にかかるエグレス料金を回避...