Points Clés
- AgileRL a levé 7,5 millions de dollars en amorçage, mené par Fusion Fund.
- La plateforme de la startup, Arena, utilise l'apprentissage par renforcement (RL) pour entraîner des modèles IA.
- Le logiciel a été téléchargé plus de 300 000 fois et est utilisé par Airbus, IBM et JPMorgan.
- Cofondé par Param Kumar et Nicholas Ustaran-Anderegg en 2023.
- La société prévoit d'ouvrir un bureau à San Francisco et d'embaucher plus d'une dizaine de personnes.
Résumé Rapide
La startup basée à Londres AgileRL a levé 7,5 millions de dollars en amorçage pour étendre sa plateforme de logiciel d'entraînement IA. L'entreprise a été cofondée en 2023 par Param Kumar et Nicholas Ustaran-Anderegg.
AgileRL se concentre sur l'apprentissage par renforcement (RL), une technique d'entraînement IA où les systèmes apprennent en essayant des actions et en s'améliorant grâce aux retours. Bien que cette technologie remonte aux années 1950, elle connaît actuellement une renaissance dans les laboratoires IA.
La startup a créé une plateforme appelée Arena. Ce logiciel permet aux ingénieurs et aux data scientists de plonger leurs modèles IA dans des simulations, de les affiner avant le déploiement et de les surveiller pendant leur exécution.
Selon l'entreprise, la plateforme a été téléchargée plus de 300 000 fois. Elle est actuellement utilisée par de grandes sociétés dont Airbus, IBM et JPMorgan.
Le tour de financement a été mené par Fusion Fund, avec la participation de Flying Fish, Octopus Ventures, Entrepreneur First et Counterview Capital. AgileRL prévoit d'utiliser ce capital pour ouvrir un bureau à San Francisco et embaucher plus d'une dizaine de personnes pour les postes d'ingénierie et de mise sur le marché.
La Plateforme Arena et Détails du Financement
AgileRL a sécurisé 7,5 millions de dollars en amorçage pour accélérer le développement de son logiciel propriétaire. La startup, basée à Londres, vise à simplifier le processus complexe de l'entraînement IA pour les entreprises.
Le cœur de leur offre est une plateforme nommée Arena. Elle est conçue pour être un environnement complet où les développeurs peuvent gérer l'ensemble du cycle de vie d'un modèle IA. Plus précisément, Arena permet aux utilisateurs de :
- Plonger des modèles IA dans la plateforme
- Exécuter des simulations
- Affiner les modèles avant le déploiement
- Surveiller les modèles pendant qu'ils sont en cours d'exécution
L'entreprise soutient que sa solution accélère le développement IA car les outils d'entraînement sont consolidés en un seul endroit et sont « prêts à l'emploi ». Cela contraste avec l'alternative consistant à créer un laboratoire IA propriétaire à partir de zéro, ce qui est souvent intensif en ressources.
Concernant le modèle économique, AgileRL offre un niveau gratuit qui donne aux utilisateurs accès à une quantité limitée de crédits d'entraînement. Pour des besoins plus importants, des niveaux payants sont disponibles pour les entreprises et les professionaux, ainsi que des licences personnalisées pour les grandes entreprises.
Le Virage vers l'Apprentissage par Renforcement
AgileRL mise sur l'apprentissage par renforcement (RL), une technique qui a des racines remontant aux années 1950. Contrairement aux autres méthodologies IA, le RL implique que les systèmes apprennent étape par étape en essayant des actions et en s'améliorant en fonction des retours qu'ils reçoivent.
Param Kumar, le PDG d'AgileRL, a fourni un aperçu des tendances actuelles du marché concernant les technologies d'entraînement IA. Il a noté un changement significatif suite au lancement de ChatGPT fin 2022.
« Après le lancement de ChatGPT fin 2022, les entreprises ont déplacé leurs budgets du travail sur le RL pour se concentrer sur les transformateurs », a déclaré Kumar. Les transformateurs (transformers) sont la technologie qui sous-tend les grands modèles de langage, apprenant des modèles à partir de grands ensembles de données d'un seul coup.
Cependant, Kumar croit que l'industrie réalise les limites de cette approche. « Maintenant, dit-il, de plus en plus d'entreprises réalisent que les transformateurs ne peuvent les mener que jusqu'à un certain point. » Il a expliqué que bien que les transformateurs soient excellents, ils sont essentiellement de grands modèles statistiques.
Kumar a élaboré sur la nécessité de combiner les technologies : « La réalité est que vous devrez ajouter le RL par-dessus, car il n'y a que tant que vous pouvez inférer à partir des données. »
Applications Pratiques et Croissance
Pour illustrer l'application pratique de l'apprentissage par renforcement, Param Kumar a fourni un exemple spécifique impliquant la robotique. Il a décrit un scénario où un bras robotique a pour tâche de déplacer une balle d'une table à une autre.
Kumar a expliqué que ce mouvement n'est pas une action unique mais peut être décomposé en de nombreuses tâches plus petites. Celles-ci incluent saisir la balle, lever le bras et déplacer l'articulation. Il a noté que la plateforme d'AgileRL permet aux ingénieurs de définir des paramètres pour s'améliorer à ces tâches spécifiques.
La startup a connu une adoption significative depuis sa création. La plateforme a été téléchargée plus de 300 000 fois. Elle a également attiré des clients d'entreprise de premier plan, avec une utilisation confirmée par des entreprises dont Airbus, IBM et JPMorgan.
Avec le tour d'amorçage de 7,5 millions de dollars mené par Fusion Fund, AgileRL est positionnée pour une expansion rapide. Le capital soutiendra l'ouverture d'un nouveau bureau à San Francisco. De plus, la startup prévoit d'embaucher plus d'une dizaine de personnes pour pourvoir les postes d'ingénierie et de mise sur le marché.
Conclusion
AgileRL représente une tendance croissante dans le secteur de l'IA : le retour à l'apprentissage par renforcement pour résoudre des problèmes complexes que les grands modèles de langage ne peuvent pas gérer seuls. En fournissant une plateforme accessible et prête à l'emploi comme Arena, la startup abaisse la barrière à l'entrée pour les entreprises souhaitant mettre en œuvre un entraînement IA avancé.
Avec le solide soutien d'investisseurs comme Fusion Fund et une base d'utilisateurs qui inclut certaines des plus grandes entreprises du monde, AgileRL est bien positionnée pour capitaliser sur l'intérêt renouvelé pour le RL. L'expansion prévue à San Francisco et l'augmentation des embauches signalent un engagement à faire évoluer leurs opérations à l'échelle mondiale.
Alors que le paysage de l'IA continue d'évoluer, la capacité à combiner la puissance statistique des transformateurs avec l'apprentissage étape par étape de l'apprentissage par renforcement définira probablement la prochaine génération d'applications IA. AgileRL vise à être à l'avant-garde de cette convergence technologique.
« Après le lancement de ChatGPT fin 2022, les entreprises ont déplacé leurs budgets du travail sur le RL pour se concentrer sur les transformateurs. »
— Param Kumar, PDG d'AgileRL
« Nous avons réalisé très tôt que les transformateurs sont excellents, mais ce sont de grands modèles statistiques. »
— Param Kumar, PDG d'AgileRL
« La réalité est que vous devrez ajouter le RL par-dessus, car il n'y a que tant que vous pouvez inférer à partir des données. »
— Param Kumar, PDG d'AgileRL



