Hechos Clave
- AgileRL recaudó 7,5 millones de dólares en una ronda de financiación inicial liderada por Fusion Fund.
- La plataforma de la startup, Arena, utiliza el aprendizaje por refuerzo (RL) para entrenar modelos de IA.
- El software ha sido descargado más de 300.000 veces y es utilizado por Airbus, IBM y JPMorgan.
- Fue cofundada por Param Kumar y Nicholas Ustaran-Anderegg en 2023.
- La empresa planea abrir una oficina en San Francisco y contratar a más de una docena de empleados.
Resumen Rápido
La startup con sede en Londres AgileRL ha recaudado 7,5 millones de dólares en una ronda de financiación inicial para expandir su plataforma de software de entrenamiento de IA. La empresa fue cofundada en 2023 por Param Kumar y Nicholas Ustaran-Anderegg.
AgileRL se enfoca en el aprendizaje por refuerzo (RL), una técnica de entrenamiento de IA donde los sistemas aprenden probando acciones y mejorando basándose en la retroalimentación. Aunque esta tecnología se remonta a la década de 1950, actualmente está experimentando un renacimiento en los laboratorios de IA.
La startup ha creado una plataforma llamada Arena. Este software permite a ingenieros y científicos de datos introducir sus modelos de IA en simulaciones, ajustarlos antes de su implementación y monitorearlos mientras se ejecutan.
Según la empresa, la plataforma ha sido descargada más de 300.000 veces. Actualmente es utilizada por grandes corporaciones que incluyen a Airbus, IBM y JPMorgan.
La ronda de financiación fue liderada por Fusion Fund, con la participación de Flying Fish, Octopus Ventures, Entrepreneur First y Counterview Capital. AgileRL planea utilizar el capital para abrir una oficina en San Francisco y contratar a más de una docena de personas para roles de ingeniería y de entrada al mercado.
La Plataforma Arena y Detalles de la Financiación
AgileRL ha asegurado 7,5 millones de dólares en una ronda de financiación inicial para acelerar el desarrollo de su software propietario. La startup, con sede en Londres, tiene como objetivo simplificar el complejo proceso de entrenamiento de IA para las empresas.
El núcleo de su oferta es una plataforma denominada Arena. Está diseñada para ser un entorno integral donde los desarrolladores pueden gestionar todo el ciclo de vida de un modelo de IA. Específicamente, Arena permite a los usuarios:
- Introducir modelos de IA en la plataforma
- Ejecutar simulaciones
- Ajustar modelos antes de su implementación
- Monitorear modelos mientras están en ejecución activa
La empresa argumenta que su solución acelera el desarrollo de IA porque las herramientas de entrenamiento están consolidadas en un solo lugar y son "listas para usar". Esto contrasta con la alternativa de configurar un laboratorio de IA propietario desde cero, lo cual suele ser intensivo en recursos.
En cuanto al modelo de negocio, AgileRL ofrece un nivel gratuito que proporciona a los usuarios acceso a una cantidad limitada de créditos de entrenamiento. Para necesidades más grandes, hay disponibles niveles de pago para empresas y profesionales, junto con licencias personalizadas para grandes corporaciones.
El Cambio hacia el Aprendizaje por Refuerzo
AgileRL está apostando por el aprendizaje por refuerzo (RL), una técnica que tiene sus raíces en la década de 1950. A diferencia de otras metodologías de IA, el RL implica que los sistemas aprendan paso a paso probando acciones y mejorando basándose en la retroalimentación que reciben.
Param Kumar, el CEO de AgileRL, proporcionó una visión de las tendencias actuales del mercado en cuanto a las tecnologías de entrenamiento de IA. Señaló un cambio significativo tras el lanzamiento de ChatGPT a finales de 2022.
"Después del lanzamiento de ChatGPT a finales de 2022, las empresas movieron sus presupuestos del trabajo en RL para enfocarse en los transformadores", declaró Kumar. Los transformadores son la tecnología que sustenta los grandes modelos de lenguaje, aprendiendo patrones de grandes conjuntos de datos de una sola vez.
Sin embargo, Kumar cree que la industria se está dando cuenta de las limitaciones de este enfoque. "Ahora, dice que más empresas se dan cuenta de que los transformadores solo pueden llevarlos hasta cierto punto". Explicó que, aunque los transformadores son excelentes, son esencialmente grandes modelos estadísticos.
Kumar detalló la necesidad de combinar tecnologías: "La realidad es que necesitarás añadir RL encima de eso, porque solo puedes inferir tanto de los datos".
Aplicaciones Prácticas y Crecimiento
Para ilustrar la aplicación práctica del aprendizaje por refuerzo, Param Kumar proporcionó un ejemplo específico que involucra robótica. Describió un escenario donde un brazo robótico tiene la tarea de mover una pelota de una mesa a otra.
Kumar explicó que este movimiento no es una sola acción, sino que se puede desglosar en muchas tareas más pequeñas. Estas incluyen agarrar la pelota, levantar el brazo y mover la articulación. Señaló que la plataforma de AgileRL permite a los ingenieros establecer parámetros para mejorar en estas tareas específicas.
La startup ha visto una adopción significativa desde su creación. La plataforma ha sido descargada más de 300.000 veces. También ha atraído a clientes empresariales de alto perfil, con el uso confirmado por empresas que incluyen a Airbus, IBM y JPMorgan.
Con la ronda inicial de 7,5 millones de dólares liderada por Fusion Fund, AgileRL está posicionada para una rápida expansión. El capital apoyará la apertura de una nueva oficina en San Francisco. Además, la startup planea contratar a más de una docena de personas para cubrir roles de ingeniería y de entrada al mercado.
Conclusión
AgileRL representa una tendencia creciente en el sector de la IA: el regreso al aprendizaje por refuerzo para resolver problemas complejos que los grandes modelos de lenguaje no pueden manejar por sí solos. Al proporcionar una plataforma accesible y lista para usar como Arena, la startup está reduciendo la barrera de entrada para las empresas que buscan implementar entrenamientos avanzados de IA.
Con un fuerte respaldo de inversores como Fusion Fund y una base de usuarios que incluye algunas de las corporaciones más grandes del mundo, AgileRL está bien posicionada para capitalizar el renovado interés en el RL. La expansión planificada a San Francisco y la contratación incrementada señalan un compromiso para escalar sus operaciones a nivel global.
A medida que el panorama de la IA continúa evolucionando, la capacidad de combinar el poder estadístico de los transformadores con el aprendizaje paso a paso del aprendizaje por refuerzo probablemente definirá la próxima generación de aplicaciones de IA. AgileRL tiene como objetivo estar a la vanguardia de esta convergencia tecnológica.
"Después del lanzamiento de ChatGPT a finales de 2022, las empresas movieron sus presupuestos del trabajo en RL para enfocarse en los transformadores."
— Param Kumar, CEO de AgileRL
"Nos dimos cuenta temprano de que los transformadores son excelentes, pero son estos grandes modelos estadísticos."
— Param Kumar, CEO de AgileRL
"La realidad es que necesitarás añadir RL encima de eso, porque solo puedes inferir tanto de los datos."
— Param Kumar, CEO de AgileRL




