Hoy finaliza nuestra primera Agents Week, una semana de la innovación dedicada por completo a la era de los agentes. No podría haber sido más oportuno: durante el último año, los agentes han cambiado rápidamente la forma de trabajar de las personas. Los agentes de codificación ayudan a los desarrolladores a realizar entregas más rápido que nunca. Los agentes de soporte resuelven los tickets de un extremo a otro. Los agentes de investigación validan las hipótesis de cientos de fuentes en cuestión de minutos. Y las personas no solo ejecutan un agente, sino que ejecutan varios en paralelo, las 24 horas del día.
Como señalaron el director técnico de Cloudflare, Dane Knecht, y la vicepresidenta de producto, Rita Kozlov, en nuestra publicación de bienvenida a Agents Week, la escala potencial de los agentes es asombrosa: si solo una fracción de los trabajadores del conocimiento del mundo ejecuta cada uno unos pocos agentes en paralelo, necesitas capacidad informática para decenas de millones de sesiones simultáneas. El modelo de "una aplicación para muchos usuarios" en el que se construyó la nube no funciona para eso. Pero eso es exactamente lo que los desarrolladores y las empresas buscan: crear agentes, ponerlos a disposición de los usuarios y ejecutarlos a gran escala.
Llegar allí significa resolver problemas en toda la pila. Los agentes necesitan una capacidad de cómputo que escale desde sistemas operativos completos hasta aislamientos ligeros. Necesitan seguridad e identidad integradas en cómo funcionan. Necesitan una caja de herramientas para los agentes: los modelos, las herramientas y el contexto adecuados para hacer un trabajo real. Todo el código que generan los agentes necesita una ruta clara desde el prototipo inicial hasta la aplicación de producción. Y, por último, a medida que los agentes generan una proporción cada vez mayor del tráfico de Internet, la propia web debe adaptarse a la emergente web de agentes. Resulta que la plataforma informática sin contenedores y sin servidor que lanzamos hace ocho años con Workers estaba preparada para este momento. Desde entonces, la hemos convertido en una plataforma completa, y esta semana lanzamos una nueva serie de primitivas diseñadas a medida para agentes, organizadas precisamente en torno a esos problemas.
Estamos aquí para crear Cloud 2.0, la nube de agentes. Infraestructura diseñada para un mundo en el que los agentes son una carga de trabajo principal.
Aquí tienes una lista de todo lo que hemos anunciado esta semana, ¡no te pierdas nada!
Comienza con la computación. Los agentes necesitan un lugar donde ejecutarse, y un lugar donde almacenar y ejecutar el código que escriben. No todos los agentes necesitan lo mismo: algunos necesitan un sistema operativo completo para instalar paquetes y ejecutar comandos de terminal, la mayoría necesita algo ligero que se inicie en milisegundos y escale a millones. Esta semana lanzamos los entornos para ejecutarlos, así como un nuevo espacio de trabajo compatible con Git para los agentes:
Ejecutar agentes y su código es solo la mitad del desafío. Los agentes se conectan a redes privadas, acceden a servicios internos y realizan acciones autónomas en nombre de los usuarios. Cuando cualquiera en una organización puede crear sus propios agentes, la seguridad no puede ser una ocurrencia tardía. Tiene que ser la opción por defecto. Esta semana, lanzamos las herramientas para facilitarlo.
Un agente competente debe ser capaz de pensar, recordar, comunicarse y ver. Esto significa contar con los modelos adecuados, con acceso a las herramientas adecuadas y el contexto apropiado para la tarea en cuestión. Esta semana presentamos las primitivas (inferencia, búsqueda, memoria, voz, correo electrónico y un navegador) que convierten a un agente en algo que realmente permite realizar el trabajo.
Anuncio | Resumen |
|---|
Project Think: construimos la próxima generación de agentes de IA en Cloudflare | Anunciamos una versión preliminar de la próxima edición del SDK de agentes: desde primitivas básicas a una plataforma completa (con baterías integradas) para agentes de IA que piensan, actúan y persisten. |
Agrega voz a tu agente | Una canalización de voz experimental para el SDK de Agents permite interacciones de voz en tiempo real a través de WebSockets. Los desarrolladores ahora pueden crear agentes con STT y TTS continuos en apenas unas 30 líneas de código del lado del servidor. |
Cloudflare Email Service: ahora en versión beta pública. Listo para tus agentes. | Los agentes están evolucionando hacia un modelo multicanal. Eso significa ponerlos al alcance donde ya están tus usuarios, incluso en la bandeja de entrada. Hoy, Cloudflare Email Service entra en la fase beta pública con una capa de infraestructura que facilita la tarea: enviar, recibir y procesar correos electrónicos de manera nativa desde tus agentes. |
La plataforma de IA de Cloudflare: una capa de inferencia diseñada para agentes | Estamos transformando Cloudflare en una capa de inferencia unificada para agentes, que permite a los desarrolladores acceder a modelos de más de 14 proveedores. Entre las novedades se incluye una integración de Workers para ejecutar modelos de terceros y un catálogo ampliado con modelos multimodales. |
Construir la base para ejecutar modelos lingüísticos muy grandes | Creamos una pila tecnológica personalizada para ejecutar modelos lingüísticos de gran tamaño y rápidos en la infraestructura de Cloudflare. Este artículo analiza las compensaciones de ingeniería y las optimizaciones técnicas necesarias para que la inferencia de IA de alto rendimiento sea accesible. |
Unweight: cómo logramos comprimir un LLM en un 22 % sin perder la calidad | La ejecución de grandes LLM en la red de Cloudflare nos exige optimizar el uso del ancho de banda de memoria de las GPU con mayor inteligencia y eficiencia. Por eso hemos desarrollado Unweight, un sistema de compresión sin pérdida aplicado durante la inferencia que logra reducir hasta un 22 % la huella del modelo, lo que nos permite ofrecer inferencias más rápidas y económicas que nunca. |
Agentes que recuerdan: presentamos Agent Memory | Cloudflare Agent Memory es un servicio gestionado que ofrece a los agentes de IA una memoria persistente, permitiéndoles recordar lo importante, olvidar lo irrelevante y volverse más inteligentes con el tiempo. |
AI Search: la primitiva de búsqueda para tus agentes | AI Search es la primitiva de búsqueda para tus agentes. Crea instancias de forma dinámica, carga archivos y realiza búsquedas entre instancias con recuperación híbrida y refuerzo de relevancia. Solo tienes que crear una instancia de búsqueda, cargar y buscar. |
Browser Run: brinda un navegador a tus agentes | Browser Rendering es ahora Browser Run, con Live View, Human in the Loop, acceso a CDP, grabaciones de sesiones y límites de concurrencia 4 veces mayores para los agentes de IA. |
De prototipo a producción
La mejor infraestructura es también la que es fácil de usar. Queremos llegar a los desarrolladores y a sus agentes donde ya están trabajando: en la terminal, en el editor, en un prompt, y hacer que la plataforma de Cloudflare sea accesible sin cambios de contexto.
A medida que más agentes se conectan, siguen navegando en el Internet que se creó para las personas. Los sitios web existentes necesitan nuevas herramientas para controlar qué bots pueden acceder a tu contenido, empaquetarlo y presentarlo a tus agentes, y medir tu preparación para este cambio.
Anuncio | Resumen |
|---|
Presentamos el diagnóstico de preparación de los agentes. ¿Está tu sitio web listo para agentes de IA? | El diagnóstico de preparación para agentes permite a los administradores de sitios evaluar hasta qué punto sus páginas están listas para trabajar con agentes de IA. Aquí presentamos los nuevos estándares, compartimos datos de Radar y explicamos cómo logramos que la documentación de Cloudflare sea la más accesible para agentes de IA en la web. |
Redirecciones para entrenamiento de IA aplica contenido canónico | Las directivas poco estrictas no impiden que los rastreadores consuman contenido obsoleto. Redirects for AI Training permite que cualquier usuario de Cloudflare dirija a los rastreadores verificados hacia páginas canónicas con un solo ajuste y sin necesidad de modificar el servidor de origen. |
Agents Week: actualización del rendimiento de la red | Al migrar nuestra capa de gestión de solicitudes a una arquitectura basada en Rust llamada FL2, Cloudflare ha aumentado su ventaja de rendimiento en el 60 % de las principales redes del mundo. Utilizamos mediciones de usuarios reales y medias recortadas de conexión TCP para garantizar que nuestros datos reflejen la experiencia real de las personas en Internet. |
Shared Dictionaries: una compresión que sigue el ritmo de la web orientada a agentes | Te damos un adelanto de nuestro soporte para diccionarios de compresión compartidos, te mostramos cómo mejoran los tiempos de carga de las páginas y te anunciamos cuándo podrás probar la versión beta por tu cuenta. |
Agents Week 2026 está por terminar, pero la nube de agentes apenas está comenzando. Todo lo que presentamos esta semana, desde la computación y la seguridad hasta la caja de herramientas del agente y la web de agentes, es la base. Seguiremos desarrollándolo para darte todo lo que necesitas para construir el futuro.
También publicaremos más entradas de blog hoy y mañana para continuar la historia, así que mantente atento a las últimas novedades en nuestro blog.
Si estás desarrollando algo a partir de lo que anunciamos esta semana, queremos saberlo. Visítanos en X o Discord, o consulta la documentación para desarrolladores.