為執行大型 LLM 建立基礎
2026-04-16
我們建置了自訂技術堆疊,以在 Cloudflare 的基礎架構上執行高速的大型語言模型。本文探討了為了實現高可用、高效能的 AI 推斷,所涉及的工程權衡取捨與技術最佳化。...
繼續閱讀 »
2026-04-16
我們建置了自訂技術堆疊,以在 Cloudflare 的基礎架構上執行高速的大型語言模型。本文探討了為了實現高可用、高效能的 AI 推斷,所涉及的工程權衡取捨與技術最佳化。...
繼續閱讀 »
2025-12-22
在全球網路上,實體資料中心的維護工作充滿風險。為此,我們在 Workers 上建立了一個維護排程器,用以安全地規劃具有破壞性的操作;同時,透過在多個資料來源與指標管線之上引入圖形介面來洞察基礎架構的整體狀態,從而解決了擴展過程中遇到的種種挑戰。...