Oggi si conclude la nostra prima Agents Week, una settimana dell'innovazione dedicata interamente all'era degli agenti. Non avrebbe potuto essere più in linea con i tempi: nell'ultimo anno, gli agenti hanno rapidamente cambiato le modalità di lavoro delle persone. Gli agenti di codifica stanno aiutando gli sviluppatori a rilasciare/distribuire in tempi più rapidi che mai. Gli agenti di supporto risolvono i ticket end-to-end. Gli agenti di ricerca convalidano le ipotesi su centinaia di fonti in pochi minuti. E le persone non gestiscono solo un agente: ne eseguono diversi in parallelo e 24 ore su 24.
Come hanno notato il CTO di Cloudflare Dane Knecht e il VP of Product Rita Kozlov nel nostro post di benvenuto alla Agents Week, la scala potenziale degli agenti è sbalorditiva: se anche solo una piccola parte dei knowledge worker di tutto il mondo eseguono alcuni agenti in parallelo, è necessaria capacità di elaborazione per decine di milioni di sessioni simultanee. Il modello one-app-serve-many-users su cui è basato il cloud da sempre non funziona più in questo nuovo scenario. Ma questo è esattamente ciò che gli sviluppatori e le aziende vogliono fare: creare agenti, distribuirli agli utenti ed eseguirli su larga scala.
Arrivarci significa risolvere i problemi dell'intero stack. Gli agenti hanno bisogno di elaborazione in grado di scalare da sistemi operativi completi a isolati leggeri. Hanno bisogno di sicurezza e identità integrate nel modo in cui vengono eseguite. Hanno bisogno di una toolbox per gli agenti: i modelli, gli strumenti e il contesto giusti per svolgere un lavoro reale. Tutto il codice generato dagli agenti ha bisogno di un percorso chiaro dal prototipo del alla produzione. E infine, poiché gli agenti guidano una quota crescente del traffico Internet, il web stesso deve adattarsi al web agentico emergente. Abbiamo scoperto che la piattaforma di elaborazione containerless e serverless che abbiamo lanciato otto anni fa con Workers era pronta per questo momento. Da allora, l'abbiamo trasformata in una piattaforma completa e questa settimana abbiamo lanciato la prossima ondata di primitive create appositamente per gli agenti, organizzate esattamente per risolvere questi problemi.
Siamo qui per creare il Cloud 2.0: il cloud agentico. Un'infrastruttura progettata per un mondo in cui gli agenti sono un carico di lavoro primario.
Ecco un elenco di tutto ciò che abbiamo annunciato questa settimana: non vorremmo che ti perdessi nulla.
Inizia con l'elaborazione. Gli agenti hanno bisogno di un luogo in cui eseguire, archiviare ed eseguire il codice che scrivono. Non tutti gli agenti hanno bisogno della stessa cosa: alcuni richiedono un sistema operativo completo per installare pacchetti ed eseguire comandi del terminale, la maggior parte ha bisogno di qualcosa di leggero che si avvii in pochi millisecondi e scali nell'ordine di milioni. Questa settimana abbiamo fornito gli ambienti per eseguirli, oltre a un nuovo spazio di lavoro compatibile con Git per gli agenti:
L'esecuzione degli agenti e del loro codice è solo metà della sfida. Gli agenti si connettono a reti private, accedono ai servizi interni e intraprendono azioni autonome per conto degli utenti. Quando chiunque in un'organizzazione può creare i propri agenti, la sicurezza non può essere un ripensamento. Deve essere l'impostazione predefinita. Questa settimana abbiamo lanciato gli strumenti per semplificare tutto questo.
Annuncio | Riepilogo |
|---|
Rete privata sicura per tutti: utenti, nodi, agenti, Workers: presentazione di Cloudflare Mesh | Cloudflare Mesh fornisce un accesso sicuro e privato alla rete per utenti, nodi e agenti IA autonomi. Integrandosi con Workers VPC, gli sviluppatori possono ora concedere agli agenti l'accesso con ambito a database e API privati senza tunnel manuali. |
OAuth gestita per Access: rendi le app interne pronte per gli agenti con un semplice clic | L'autenticazione OAuth gestita per Cloudflare Access consente agli agenti IA di navigare in modo sicuro nelle applicazioni interne. Adottando la RFC 9728, gli agenti possono autenticarsi per conto degli utenti senza utilizzare account di servizio non sicuri. |
Proteggere le identità non umane: revoca automatica, OAuth e autorizzazioni con ambito limitato | Cloudflare introduce i token API scansionabili, una maggiore visibilità per OAuth e la disponibilità generale (GA) per le autorizzazioni a livello di risorsa. Questi strumenti aiutano gli sviluppatori a implementare una vera architettura a privilegi minimi, proteggendoli al contempo dalla fuga di credenziali. |
Adozione su larga scala di MCP: la nostra architettura di riferimento per le distribuzioni aziendali di MCP | Condividiamo la strategia interna di Cloudflare per la gestione di MCP tramite Access, AI Gateway e i portali del server MCP. Inoltre, lanciamo la modalità codice per ridurre drasticamente i costi dei token e raccomandiamo nuove regole per il rilevamento di Shadow MCP in Cloudflare Gateway. |
Un agente capace deve essere in grado di pensare e ricordare, comunicare e vedere. Questo richiede che sia basato sui modelli giusti, con accesso agli strumenti giusti e al contesto giusto per svolgere le proprie attività al meglio. Questa settimana abbiamo distribuito le primitive (inferenza, ricerca, memoria, voce, e-mail e un browser) che trasformano un agente in qualcosa che funziona davvero.
Annuncio | Riepilogo |
|---|
Project Think: creare la nuova generazione di agenti IA su Cloudflare | Annunciamo un'anteprima della prossima edizione di Agents SDK, dalle primitive leggere a una piattaforma dotata di batterie per agenti IA che pensano, agiscono e persistono. |
Aggiungere la voce al tuo agente | Una pipeline vocale sperimentale per l'SDK Agents consente interazioni vocali in tempo reale tramite WebSockets. Gli sviluppatori possono ora creare agenti con STT e TTS continui in sole 30 righe di codice lato server. |
Cloudflare Email Service è ora in versione beta pubblica. Pronto per i tuoi agenti | Gli agenti stanno diventando multicanale. Ciò significa renderli disponibili ovunque si trovino già i tuoi utenti, inclusa la casella di posta elettronica. Cloudflare Email Service entra nella versione beta pubblica con il livello infrastrutturale per semplificare il processo: inviare, ricevere ed elaborare email in modo nativo dai tuoi agenti. |
La piattaforma IA di Cloudflare: un livello di inferenza progettato per gli agenti | Stiamo integrando Cloudflare in un livello di inferenza unificato per gli agenti, consentendo agli sviluppatori di richiamare modelli da oltre 14 provider. Tra le nuove funzionalità figurano il binding Workers per l'esecuzione di modelli di terzi e un catalogo ampliato con modelli multimodali. |
Costruire le basi per l'esecuzione di modelli linguistici di dimensioni extra-large | Abbiamo creato uno stack tecnologico personalizzato per eseguire LLM e ad alta velocità sull'infrastruttura di Cloudflare. Questo articolo esplora i compromessi ingegneristici e le ottimizzazioni tecniche necessarie per rendere accessibile l'inferenza IA ad alte prestazioni. |
Unweight: come abbiamo compresso un LLM del 22% senza sacrificare la qualità | L'esecuzione di LLM sulla rete di Cloudflare richiede un utilizzo più smart ed efficiente della larghezza di banda della memoria GPU. Per questo motivo, abbiamo sviluppato Unweight, un sistema di compressione senza perdite per il tempo di inferenza che riduce il footprint del modello di fino al 22%, in modo da offrire inferenze più rapide ed economiche che mai. |
Agenti che ricordano: presentazione di Agent Memory | Cloudflare Agent Memory è un servizio gestito che fornisce agli agenti IA una memoria persistente, consentendo loro di ricordare ciò che conta, dimenticare quello che non conta e diventare più smart nel tempo. |
AI Search: la primitiva di ricerca per i tuoi agenti | AI Search è la primitiva di ricerca per i tuoi agenti. Crea istanze in modo dinamico, carica file ed effettua ricerche tra le istanze con recupero ibrido e miglioramento della pertinenza. È sufficiente creare un'istanza di ricerca, caricare i dati ed eseguire la ricerca. |
Browser Run: fornisci un browser ai tuoi agenti | Il rendering del browser è ora Browser Run, con Live View, Human in the Loop, accesso a CDP, registrazione delle sessioni e limiti di simultaneità quattro volte superiori per gli agenti IA. |
Prototipo alla produzione
Per essere considerata tra le migliori, un'infrastruttura deve essere anche facile da usare. Vogliamo incontrare gli sviluppatori e i loro agenti dove stanno già lavorando: nel terminale, nell'editor, in un prompt e rendere accessibile l'intera piattaforma Cloudflare senza cambio di contesto.
Man mano che sempre più agenti si collegano online, continuano a navigare su Internet, uno strumento creato per le persone. I siti web esistenti necessitano di nuovi strumenti per controllare a quali contenuti i bot possono accedere, per organizzarli e presentarli agli agenti, e per misurare quanto sono pronti per questo cambiamento.
Annuncio | Riepilogo |
|---|
Introduzione del punteggio di predisposizione agli agenti. Il tuo sito è predisposto agli agenti? | Il punteggio di predisposizione agli agenti può aiutare i proprietari di siti web a capire l'efficienza con cui i loro siti supportano gli agenti IA. Qui esploriamo nuovi standard, condividiamo i dati di Radar e spieghiamo in dettaglio come abbiamo reso la documentazione di Cloudflare la più intuitiva per gli agenti sul web. |
I reindirizzamenti per l'addestramento dell'IA rafforzano i contenuti canonici | Le direttive non restrittive non impediscono ai crawler di acquisire contenuti obsoleti. Redirects for AI Training consente a chiunque utilizzi Cloudflare di reindirizzare i crawler verificati alle pagine canoniche con un semplice clic e senza modificare l'origine del sito. |
Agents Week: Aggiornamento delle prestazioni di rete | Migrando il nostro livello di gestione delle richieste a un'architettura basata su Rust chiamata FL2, Cloudflare ha aumentato il suo vantaggio in termini di performance al 60% delle principali reti del mondo. Utilizziamo misurazioni degli utenti reali e trimean delle connessioni TCP per garantire che i nostri dati riflettano l'esperienza effettiva delle persone su Internet. |
Compressione dei dizionari condivisi al passo con il web agentico | Ti diamo un'anteprima del nostro supporto per i dizionari di compressione condivisi, ti mostriamo come migliorano i tempi di caricamento delle pagine e ti riveliamo quando potrai provare la versione beta. |
La Agents Week 2026 sta terminando, ma il cloud agentico è solo all'inizio. Tutto ciò che abbiamo mostrato questa settimana, dall'elaborazione e dalla sicurezza agli strumenti per agenti e al web agentico, è la base. Continueremo a basarci su questo per darti tutto ciò di cui hai bisogno per realizzare quello che verrà dopo.
Abbiamo anche altri post sul blog in uscita oggi e domani con ulteriori approfondimenti, quindi tieni d'occhio le ultime novità sul nostro blog.
Se ti stai basando su ciò che abbiamo annunciato questa settimana, ti chiediamo di farcelo sapere. Vieni a trovarci su X o Discord, oppure consulta la documentazione per gli sviluppatori.