Lecture: 5 min.
Nous avons d'importantes nouvelles à communiquer aujourd'hui : Replicate, la principale plateforme d'exécution de modèles d'IA, rejoint Cloudflare.
Au-delà d'une simple passion pour les palettes de couleurs vives, ce sont nos nombreux points communs qui nous ont poussés à engager la discussion avec Replicate. Notre mission vis-à-vis de la plateforme de développement Workers de Cloudflare a été de simplifier au maximum la création et le déploiement d'applications full-stack. Entre-temps, Replicate s'est donné une mission similaire : faire en sorte qu'il soit aussi simple de déployer des modèles d'IA que d'écrire une seule ligne de code. Nous avons réalisé que nous pouvions construire quelque chose d'encore mieux ensemble en intégrant directement la plateforme Replicate à Cloudflare.
Nous sommes ravis d'annoncer cette nouvelle et encore plus enthousiastes à l'idée des avantages qu'elle apportera à nos clients. Avec l'intégration des outils de Replicate dans Cloudflare, notre plateforme de développement continuera d'être le meilleur endroit sur Internet pour créer et déployer n'importe quel flux de travail IA ou agentique.
Qu’est-ce que cela signifie pour vous ?
Avant de consacrer plus de temps à l'avenir de l'IA, nous souhaitons répondre aux questions qui préoccupent le plus les utilisateurs de Replicate et de Cloudflare. En bref :
Pour les utilisateurs Replicate existants : vos API et flux de travail continueront de fonctionner sans interruption. Vous bénéficierez bientôt d'une amélioration des performances et de la fiabilité du réseau mondial de Cloudflare.
Pour les utilisateurs existants de Workers AI : préparez-vous à un enrichissement massif du catalogue de modèles et à des possibilités nouvelles en matière de précision des réglages et de modèles personnalisés directement sur Workers AI.
Maintenant, revenons à ce qui nourrit notre enthousiasme concernant notre avenir commun.
La révolution de l'IA n'a pas été retransmise à la télévision, mais elle a commencé avec l'open source.
Avant que l'IA ne soit l'IA, et le sujet de toutes les conversations, elle existait depuis des décennies sous le nom d'« apprentissage automatique ». C'était un domaine spécialisé, presque académique. Les progrès ont été constants, mais isolés, les percées se produisant au sein de quelques grands laboratoires de recherche bien financés. Les modèles étaient monolithiques, les données étaient propriétaires et les outils étaient inaccessibles à la plupart des développeurs. Tout a changé lorsque la culture de la collaboration open source, la force motrice derrière l'Internet moderne, a rencontré l'apprentissage automatique. Les chercheurs et les entreprises ont alors commencé à publier non seulement leurs articles, mais aussi les poids de leurs modèles et leur code.
Cela a déclenché une formidable explosion d'innovation. Le rythme des évolutions de ces dernières années a été vertigineux ; ce qui était à la pointe de la technologie il y a 18 mois (ou parfois, il semble que ce n'était qu'il y a quelques jours) est désormais la norme. Cette accélération est particulièrement visible dans le domaine de l'IA générative.
Nous sommes passés de curiosités étranges et floues à la génération d'images photoréalistes en un clin d'œil. Les modèles open source comme Stable Diffusion ont ouvert la voie à une créativité immédiate pour les développeurs, et ce n'était que le début. Si vous consultez aujourd'hui le catalogue de modèles de Replicate, vous y trouverez des milliers de modèles d'images de toutes sortes, chacun itérant sur le précédent.
Cela s'est produit non seulement avec les modèles d'image, mais aussi avec la vidéo, l'audio, les modèles de langage, pour ne citer que quelques exemples.
Cependant, cette progression incroyable, portée par la communauté, s'est accompagnée d'une difficulté majeure pour la mise en pratique : comment exécuter concrètement ces modèles ? Chaque nouveau modèle est associé à des dépendances différentes, exige du matériel GPU spécifique (et suffisamment) et fait appel à une infrastructure de service complexe pour assurer l'évolutivité. Les développeurs ont passé plus de temps à s'efforcer des régler des problèmes liés aux pilotes CUDA et les fichiers requirements.txt qu'à réellement développer leurs applications.
C'est exactement ce que Replicate a permis de résoudre. Ils ont mis au point une plateforme qui élimine toute cette complexité (en utilisant leur outil open source Cog pour regrouper les modèles dans des conteneurs standard et reproductibles), ce qui permet à n'importe quel développeur ou expert en science des données d'exécuter même les modèles open source les plus complexes avec un simple appel d'API.
Aujourd'hui, le catalogue de Replicate comprend plus de 50 000 modèles open source et modèles affinés. Si l'open source a ouvert de nombreuses possibilités, la suite d'outils de Replicate va encore plus loin en permettant aux développeurs d'accéder à tous les modèles dont ils ont besoin, en un seul endroit. Point final. Grâce à sa place de marché, elle offre également un accès transparent aux principaux modèles propriétaires tels que GPT-5 et Claude Sonnet, le tout via une API unifiée.
Il est intéressant de noter que l'équipe de Replicate n'a pas simplement créé un service d'inférence ; ils ont bâti une communauté. De nombreuses innovations peuvent avoir lieu parce qu'elles s'inspirent de ce que font d'autres, en s'appuyant sur des itérations et en améliorant les solutions. Replicate est devenu la plateforme de référence sur laquelle les développeurs peuvent découvrir, partager, ajuster et expérimenter les derniers modèles dans un environnement public.
Plus forts ensemble : le catalogue d'IA rencontre le cloud IA
Pour en revenir à la mission de Workers Platform : notre objectif a toujours été de permettre aux développeurs de créer des applications full-stack sans avoir à se soucier de l'infrastructure. Et si rien n'a changé à cet égard, l'IA a toutefois modifié les exigences des applications.
Les types d'applications que les développeurs créent évoluent ; il y a trois ans, personne ne développait d'agents ni ne créait de vidéos de lancement générées par IA. Aujourd'hui, c'est le cas. En conséquence, l'évolution concerne également ce dont ils ont besoin et ce qu'ils attendent du cloud, ou du cloud IA.
Pour répondre aux besoins des développeurs, Cloudflare a mis en place les piliers fondamentaux du cloud IA, conçu pour exécuter l'inférence en périphérie, au plus près des utilisateurs. Il ne s'agit pas simplement d'un produit, mais d'une pile complète :
Workers AI : inférence GPU serverless sur notre réseau mondial.
AI Gateway : un plan de contrôle pour la mise en cache, le contrôle du volume des requêtes et l'observation de toute API d'IA.
Pile de données : dont Vectorize (notre base de données vectorielle) et R2 (pour le stockage de modèles et de données).
Orchestration : des outils tels que AI Search (anciennement Autorag), Agents et Workflows, pour créer des applications complexes en plusieurs étapes.
Fondation : tout est basé sur notre plateforme de développement principale, Workers, Durable Objects et le reste de notre pile.
Tandis que nous aidions les développeurs à faire évoluer leurs applications, Replicate s'est donné une mission similaire : faire en sorte qu'il soit aussi simple de déployer des modèles d'IA que de déployer du code. C'est là que tout se rejoint. Replicate propose un catalogue de modèles et une communauté de développeurs parmi les plus riches et les plus dynamiques du secteur. Cloudflare apporte un réseau mondial et une plateforme d'inférence sans serveur incroyablement performants. Ensemble, nous pouvons offrir le meilleur des deux mondes : la sélection la plus complète de modèles, exécutables sur une plateforme d'inférence rapide, fiable et abordable.
Pensé pour la communauté : un centre d'exploration de l'IA
Au coeur-même de la communauté Replicate figure la possibilité de partager des modèles, de publier des réglages précis, de collecter des étoiles et d'expérimenter dans l'environnement de test. Nous continuerons d'investir et de développer cette plateforme pour en faire la destination de référence pour la découverte et l'expérimentation en matière d'IA, désormais optimisée par le réseau mondial de Cloudflare pour une expérience encore plus rapide et réactive pour tous.
Notre projet est de réunir le meilleur des deux plateformes. Nous allons intégrer l'intégralité du catalogue Replicate, soit plus de 50 000 modèles et réglages précis dans Workers AI. C'est ce qui vous offre le choix par excellence : exécuter les modèles dans l'environnement flexible de Replicate ou sur la plateforme serverless de Cloudflare, le tout depuis un seul endroit.
Mais nous ne nous contentons pas d'enrichir le catalogue. Nous sommes ravis d'annoncer l'ajout de fonctionnalités de réglage précis à Workers AI, grâce à la solide expertise de Replicate. Nous rendons également Workers AI plus flexible que jamais. Bientôt, vous pourrez apporter vos propres modèles personnalisés à notre réseau. Nous allons nous appuyer sur l'expertise de Replicate avec Cog pour rendre ce processus transparent, reproductible et facile.
Le cloud IA : bien plus que de l'inférence
L'exécution d'un modèle n'est qu'un élément du casse-tête. La magie opère lorsque vous connectez l'IA à l'ensemble de votre application. Imaginez ce que vous pouvez créer lorsque l'immense catalogue de Replicate est étroitement intégré à la plateforme pour développeurs Cloudflare : exécutez un modèle et stockez les résultats directement dans R2 ou Vectorize ; déclenchez l'inférence depuis une instance Worker ou une file d'attente ; utilisez des Durable Objects pour gérer l'état d'un agent IA ; ou créez une interface utilisateur générative en temps réel avec WebRTC et les protocoles WebSocket.
Pour gérer tout cela, nous intégrerons étroitement notre plateforme d'inférence unifiée avec la AI Gateway et vous offrons ainsi un plan de contrôle unique pour l'observabilité, la gestion des invites, les tests A/B et l'analyse des coûts sur tous vos modèles, qu'ils soient exécutés sur Cloudflare, Replicate ou un autre fournisseur, quel qu'il soit.
Bienvenue dans l’équipe !
Nous sommes extrêmement heureux d'accueillir l'équipe Replicate chez Cloudflare. Leur passion pour la communauté des développeurs et leur expertise de l'écosystème de l'IA sont sans égal. Nous sommes impatients de bâtir ensemble l'avenir de l'IA.