구독해서 새 게시물에 대한 알림을 받으세요.

Replicate가 Cloudflare에 합류합니다

2025-11-17

5분 읽기
이 게시물은 English, Français, Deutsch, 日本語, Español (Latinoamérica)繁體中文로도 이용할 수 있습니다.

오늘 중요한 소식을 전해 드립니다. AI 모델 실행을 위한 선도적인 플랫폼인 Replicate가 Cloudflare에 합류합니다.

우리가 처음 Replicate와 이야기를 시작한 건, 단지 화려한 색감에 대한 열정 때문만이 아니라 그 외에도 많은 공통점이 있었기 때문입니다. Cloudflare의 Workers 개발자 플랫폼이 추구하는 목표는 풀스택 애플리케이션을 최대한 손쉽게 구축하고 배포할 수 있도록 하는 것입니다. 한편, Replicate 역시 AI 모델을 단 한 줄의 코드만으로도 쉽게 배포할 수 있도록 하는 비슷한 목표를 가지고 있습니다. 그리고 Replicate 플랫폼을 Cloudflare에 직접 통합하면, 함께 훨씬 더 나은 것을 만들어낼 수 있다는 점을 깨달았습니다.

이 소식을 공유하게 되어 기쁘며, 이것이 고객에게 어떤 의미를 갖게 될지 더욱 기대됩니다. Replicate의 도구를 Cloudflare에 통합함으로써, 당사의 개발자 플랫폼은 모든 AI 또는 에이전트 워크플로우를 구축하고 배포하는 데 있어 인터넷 최고의 환경을 제공하는 플랫폼으로 지속적으로 발전할 것입니다.

이 소식이 귀사에게는 무엇을 의미할까요? 

본격적으로 AI의 미래에 대해 이야기하기 전에, Replicate와 Cloudflare 사용자분들이 가장 궁금해하실 질문부터 먼저 답해드리고자 합니다. 요약하자면, 

기존 Replicate 사용자: 귀하의 API와 워크플로우는 중단 없이 계속 작동합니다. 그리고 곧 Cloudflare 글로벌 네트워크의 향상된 성능과 안정성으로 인한 이점까지 누리실 수 있습니다.

기존 Workers AI 사용자: 모델 카탈로그의 대폭적인 확장과 Workers AI에서 직접 파인 튜닝 및 사용자 지정 모델을 실행할 수 있는 새로운 기능을 만나볼 수 있습니다.

이제 다시, 우리가 함께할 미래에 대해 이렇게까지 기대하고 있는 이유로 돌아가 보겠습니다.

AI 혁명은 TV로 중계되진 않았지만, 오픈 소스로부터 시작됐습니다

AI가 지금처럼 모든 대화의 중심이 되기 전, 즉 AI라고 불리기 이전 수십 년 동안은 “머신 러닝”이라는 이름으로 알려져 있었습니다. 그것은 전문적이고 거의 학문적인 분야였습니다. 기술의 발전은 꾸준했지만 각기 고립된 상태였고, 의미 있는 돌파구는 막대한 자금을 갖춘 소수의 대형 연구실 안에서만 이루어졌습니다. 대부분의 개발자에게 모델은 획일적이었고, 데이터는 독점적이었으며, 도구는 접근하기 어려웠습니다. 오픈 소스 협업 문화, 즉 현대 인터넷을 구축한 힘이 머신 러닝과 융합되면서 연구자들과 기업들이 논문뿐 아니라 모델 가중치와 코드까지 공개하기 시작했고, 이로 인해 모든 것이 바뀌었습니다.

이것은 놀라운 혁신의 폭발을 촉발했습니다. 지난 몇 년간 변화의 속도는 실로 엄청납니다. 18개월 전의(혹은 며칠 전처럼 느껴질 때도 있지만) 최첨단 기술이 이제는 기본 수준이 되었습니다. 이러한 가속화는 생성형 AI에서 가장 뚜렷하게 나타납니다. 

우리는 소름 끼치고 흐릿한 호기심 수준에서, 눈 깜짝할 사이에 사진과 구분하기 어려운 이미지 생성 단계로 도약했습니다. Stable Diffusion과 같은 오픈 소스 모델은 개발자들에게 즉각적인 창의력을 발휘할 수 있는 길을 열어주었고, 이는 시작에 불과했습니다. 오늘날 Replicate의 모델 카탈로그를 살펴보면, 거의 모든 종류의 수천 개 이미지 모델이 이전 모델을 바탕으로 계속 발전하고 있는 것을 확인할 수 있습니다. 

이는 이미지 모델뿐 아니라 비디오, 오디오, 언어 모델 등에서도 발생했습니다. 

하지만 커뮤니티가 주도한 이러한 놀라운 진전에서는 크고 현실적인 문제가 발생했습니다. 즉, 이 모델들을 실제로 운영하려면 어떻게 해야 할까요? 새로운 모델마다 서로 다른 의존성이 있고, 특정 GPU 하드웨어(충분한 수량 포함)가 필요하며, 확장성을 위해 복잡한 서빙 인프라가 요구됩니다. 개발자들은 실제 애플리케이션을 개발하는 것보다, CUDA 드라이버와 requirements.txt 파일을 다루는 데 더 많은 시간을 쓰고 있는 자신을 발견하곤 했습니다.

Replicate는 바로 이 문제를 해결했습니다. 그들은 오픈 소스 도구 Cog를 사용해 모델을 표준화되고 재현 가능한 컨테이너로 패키징함으로써 이러한 복잡성을 모두 추상화한 플랫폼을 구축했습니다. 덕분에 모든 개발자와 데이터 과학자가 가장 복잡한 오픈 소스 모델조차도 간단한 API 호출만으로 실행할 수 있게 되었습니다. 

오늘날, Replicate 카탈로그는 50,000개 이상의 오픈 소스 모델과 파인 튜닝된 모델을 포괄합니다. 오픈 소스로 인해 수많은 가능성이 열렸지만, Replicate의 툴셋은 이를 넘어 개발자들이 필요한 모든 모델에 한 곳에서 접근할 수 있도록 합니다. 단언컨대 그렇습니다. 또한 자체 마켓플레이스를 통해 GPT-5나 Claude Sonnet과 같은 주요 독점 모델에도 동일한 통합 API로 원활하게 접근할 수 있습니다.

주목할 점은 Replicate는 단순한 추론 서비스를 구축한 것이 아니라 커뮤니티를 구축했다는 것입니다. 수많은 혁신은 타인의 작업에서 영감을 얻고, 이를 반복 개선하는 과정을 통해 발생합니다. Replicate는 개발자들이 공개된 플레이그라운드에서 최신 모델을 발견하고, 공유하고, 파인 튜닝하고, 실험할 수 있는 대표적인 허브가 되었습니다. 

함께하면 더 강력해는 능력: AI 카탈로그와 AI 클라우드의 결합

Workers 플랫폼의 사명으로 돌아가서, 우리의 목표는 개발자들이 인프라에 대한 부담 없이 전체 스택 애플리케이션을 구축할 수 있도록 지원하는 것이었습니다. 그 점은 변하지 않았지만, AI가 애플리케이션의 요구 사항에 변화를 가져왔습니다.

개발자들이 구축하는 애플리케이션 유형은 변화하고 있습니다. 3년 전에는 에이전트를 구축하거나 출시 영상을 AI로 만드는 사람은 상상조차 할 수 없었지만 오늘날에는 그렇게 하고 있습니다. 결과적으로 클라우드, 또는 AI 클라우드에 대해 사람들이 필요로 하고 기대하는 바 또한 변화했습니다.

Cloudflare는 개발자 요구 사항을 충족하기 위해 사용자에게 더 가까운 엣지에서 추론을 실행하도록 설계된 AI 클라우드의 기본 토대를 구축해 왔습니다. 이것은 단순한 제품 하나가 아닌, 전체 스택입니다.

  • Workers AI: 글로벌 네트워크에서 서버리스 GPU 추론.

  • AI Gateway: 모든 AI API의 캐싱, 레이트 리미팅 및 관찰을 위한 제어판.

  • 데이터 스택: Vectorize(벡터 데이터베이스) 및 R2(모델 및 데이터 저장)를 포함.

  • 오케스트레이션: 복잡한 다단계 애플리케이션을 구축하기 위한 AI Search(이전의 Autorag), Agents, Workflows 등의 도구.

  • 기반: 모든 것이 Workers, Durable Objects 및 나머지 스택으로 구성된 Cloudflare의 핵심 개발자 플랫폼을 기반으로 구축.

우리가 개발자들이 애플리케이션을 확장하도록 돕는 동안, Replicate 역시 AI 모델을 배포하는 과정을 코드 배포만큼 간단하게 만들겠다는 비슷한 목표를 가지고 있었습니다. 바로 이 지점에서 모든 것이 하나로 연결됩니다. Replicate는 업계에서 가장 규모가 크고 활발한 모델 카탈로그 및 개발자 커뮤니티를 제공합니다. Cloudflare는 매우 뛰어난 성능의 글로벌 네트워크 및 서버리스 추론 플랫폼을 제공합니다. 함께라면, 가장 다양한 모델을 빠르고, 안정적이며, 합리적인 비용의 추론 플랫폼에서 실행할 수 있는 환경이라는 두 세계의 장점을 모두 제공할 수 있습니다.

우리의 공유된 비전

커뮤니티를 위한 AI 탐구의 중심지

모델을 공유하고, 파인 튜닝을 게시하며, 별점을 받고, 플레이그라운드에서 실험할 수 있는 기능이 바로 Replicate 커뮤니티의 핵심입니다. 우리는 이를 이제 Cloudflare의 글로벌 네트워크로 강화되어, 모든 사용자가 더 빠르고 반응성 높은 경험을 누릴 수 있는 AI 탐구와 실험의 최고 목적지로서 계속 투자하고 성장시킬 것입니다.

추론의 미래: 단일 플랫폼, 모든 모델

우리의 비전은 두 플랫폼의 최고 장점을 결합하는 것입니다. 50,000개 이상의 모델과 파인 튜닝을 포함한 Replicate 전체 카탈로그를 Workers AI로 가져올 것입니다. 이를 통해 궁극적인 선택권이 주어집니다. Replicate의 유연한 환경에서 모델을 실행할지, 아니면 Cloudflare의 서버리스 플랫폼에서 실행할지, 모든 것을 한 곳에서 관리할 수 있게 되는 것입니다.

하지만 카탈로그만 확장하는 것은 아닙니다. Replicate의 깊이 있는 전문성을 바탕으로 Workers AI에 파인 튜닝 기능을 제공하게 되어 매우 기쁩니다. 또한 Workers AI의 유연성도 이전보다 더욱 확장하고 있습니다. 이를 통해 곧 Cloudflare 네트워크에서 자체 맞춤형 모델을 사용할 수 있게 될 것입니다. 또한, Replicate의 Cog 전문성을 활용하여 이 프로세스를 원활하고 재현 가능하며 쉽게 만들 것입니다.

AI 클라우드: 단순 추론 그 이상

모델을 실행하는 것은 퍼즐의 한 부분일 뿐입니다. 진정한 마법은 AI를 전체 애플리케이션에 연결할 때 일어납니다. Replicate의 방대한 카탈로그가 Cloudflare 개발자 플랫폼 전체와 긴밀하게 통합될 때 무엇을 구축할 수 있을지 상상해 보세요. 모델을 실행하고 결과를 R2 또는 Vectorize에 직접 저장하고, Worker 또는 Queue에서 추론을 트리거하고, Durable Objects 를 사용하여 AI 에이전트의 상태를 관리하거나, WebRTC 및 WebSocket으로 실시간 생성형 UI를 구축할 수 있게 될 것입니다.

이 모든 것을 관리하기 위해 Cloudflare는 통합 추론 플랫폼을 AI Gateway와 긴밀하게 통합하여 Cloudflare, Replicate 또는 다른 공급자에서 실행되는 모든 모델에서 관찰 가능성, 프롬프트 관리, A/B 테스트 및 비용 분석을 위한 단일 제어판을 제공할 것입니다.

진심으로 환영합니다!

Replicate 팀이 Cloudflare에 합류하게 된 것을 매우 기쁘게 생각합니다. 개발자 커뮤니티에 대한 열정과 AI 생태계에 대한 전문성은 누구도 따라올 수 없습니다. AI의 미래를 함께 만들어 나가기를 기대합니다.

Cloudflare에서는 전체 기업 네트워크를 보호하고, 고객이 인터넷 규모의 애플리케이션을 효과적으로 구축하도록 지원하며, 웹 사이트와 인터넷 애플리케이션을 가속화하고, DDoS 공격을 막으며, 해커를 막고, Zero Trust로 향하는 고객의 여정을 지원합니다.

어떤 장치로든 1.1.1.1에 방문해 인터넷을 더 빠르고 안전하게 만들어 주는 Cloudflare의 무료 애플리케이션을 사용해 보세요.

더 나은 인터넷을 만들기 위한 Cloudflare의 사명을 자세히 알아보려면 여기에서 시작하세요. 새로운 커리어 경로를 찾고 있다면 채용 공고를 확인해 보세요.
Acquisitions (KO)개발자 플랫폼개발자AI

X에서 팔로우하기

Rita Kozlov|@ritakozlov_
Ben Firshman|@bfirsh
Cloudflare|@cloudflare

관련 게시물

2025년 11월 04일 오후 2:00

다단계 애플리케이션을 위한 지속형 실행 엔진인 Workflows를 위한 더 나은 테스트 환경 구축

Cloudflare Workflows의 엔드투엔드 테스트는 어려웠습니다. cloudflare:test에 최고 수준의 Workflows 지원을 도입합니다. 가장 복잡한 애플리케이션에 대해 완전한 자기 검사, 조롱 및 격리된, 안정적인 테스트가 가능합니다....

2025년 10월 24일 오후 5:10

How Cloudflare’s client-side security made the npm supply chain attack a non-event

A recent npm supply chain attack compromised 18 popular packages. This post explains how Cloudflare’s graph-based machine learning model, which analyzes 3.5 billion scripts daily, was built to detect and block exactly this kind of threat automatically....