Fatos Principais
- AgileRL arrecadou US$ 7,5 milhões em funding de seed liderado pela Fusion Fund.
- A plataforma da startup, Arena, utiliza aprendizado por reforço (RL) para treinar modelos de IA.
- O software foi baixado mais de 300.000 vezes e é usado por Airbus, IBM e JPMorgan.
- Co-fundada por Param Kumar e Nicholas Ustaran-Anderegg em 2023.
- A empresa planeja abrir um escritório em São Francisco e contratar mais de uma dezena de funcionários.
Resumo Rápido
A startup sediada em Londres AgileRL arrecadou US$ 7,5 milhões em funding de seed para expandir sua plataforma de software de treinamento de IA. A empresa foi co-fundada em 2023 por Param Kumar e Nicholas Ustaran-Anderegg.
AgileRL foca em aprendizado por reforço (RL), uma técnica de treinamento de IA onde os sistemas aprendem tentando ações e melhorando com base no feedback. Embora essa tecnologia remonte aos anos 1950, ela está atualmente vivendo um renascimento nos laboratórios de IA.
A startup criou uma plataforma chamada Arena. Esse software permite que engenheiros e cientistas de dados coloquem seus modelos de IA em simulações, os refinem antes da implantação e os monitorem enquanto estão em execução.
De acordo com a empresa, a plataforma foi baixada mais de 300.000 vezes. Atualmente, é usada por grandes corporações, incluindo Airbus, IBM e JPMorgan.
A rodada de funding foi liderada pela Fusion Fund, com participação de Flying Fish, Octopus Ventures, Entrepreneur First e Counterview Capital. AgileRL planeja usar o capital para abrir um escritório em São Francisco e contratar mais de uma dezena de pessoas para funções de engenharia e de entrada no mercado.
A Plataforma Arena e Detalhes do Funding
AgileRL garantiu US$ 7,5 milhões em funding de seed para acelerar o desenvolvimento de seu software proprietário. A startup, sediada em Londres, visa simplificar o complexo processo de treinamento de IA para empresas.
O cerne de sua oferta é uma plataforma chamada Arena. Ela foi projetada para ser um ambiente abrangente onde os desenvolvedores podem gerenciar todo o ciclo de vida de um modelo de IA. Especificamente, a Arena permite que os usuários:
- Coloquem modelos de IA na plataforma
- Executem simulações
- Façam o refinamento dos modelos antes da implantação
- Monitorem os modelos enquanto estão ativamente em execução
A empresa argumenta que sua solução acelera o desenvolvimento de IA porque as ferramentas de treinamento estão consolidadas em um único lugar e são "prontas para uso". Isso contrasta com a alternativa de configurar um laboratório de IA proprietário do zero, o que geralmente é intensivo em recursos.
Em relação ao modelo de negócios, AgileRL oferece um nível gratuito que fornece aos usuários acesso a uma quantidade limitada de créditos de treinamento. Para necessidades maiores, há níveis pagos disponíveis para empresas e profissionais, além de licenças personalizadas para grandes empresas.
A Mudança para o Aprendizado por Reforço
AgileRL está apostando no aprendizado por reforço (RL), uma técnica que tem raízes que remontam aos anos 1950. Ao contrário de outras metodologias de IA, o RL envolve sistemas que aprendem passo a passo, tentando ações e melhorando com base no feedback que recebem.
Param Kumar, CEO da AgileRL, deu uma visão sobre as tendências atuais do mercado em relação às tecnologias de treinamento de IA. Ele observou uma mudança significativa após o lançamento do ChatGPT no final de 2022.
"Após o lançamento do ChatGPT no final de 2022, as empresas moveram seus orçamentos do trabalho em RL para focar em transformers", afirmou Kumar. Transformers são a tecnologia que sustenta os grandes modelos de linguagem, aprendendo padrões de grandes conjuntos de dados de uma só vez.
No entanto, Kumar acredita que a indústria está percebendo as limitações dessa abordagem. "Agora, ele diz que mais empresas estão percebendo que transformers só podem levá-las até certo ponto." Ele explicou que, embora transformers sejam excelentes, eles são essencialmente grandes modelos estatísticos.
Kumar elaborou sobre a necessidade de combinar tecnologias: "A realidade é que você precisará adicionar RL sobre isso, porque há apenas tanto que você pode inferir dos dados."
Aplicações Práticas e Crescimento
Para ilustrar a aplicação prática do aprendizado por reforço, Param Kumar forneceu um exemplo específico envolvendo robótica. Ele descreveu um cenário onde um braço robótico tem a tarefa de mover uma bola de uma mesa para outra.
Kumar explicou que esse movimento não é uma única ação, mas pode ser dividido em muitas tarefas menores. Isso inclui agarrar a bola, levantar o braço e mover a junta. Ele observou que a plataforma da AgileRL permite que os engenheiros definam parâmetros para melhorar nessas tarefas específicas.
A startup viu uma adoção significativa desde sua criação. A plataforma foi baixada mais de 300.000 vezes. Ela também atraiu clientes empresariais de alto perfil, com uso confirmado por empresas incluindo Airbus, IBM e JPMorgan.
Com a rodada de seed de US$ 7,5 milhões liderada pela Fusion Fund, AgileRL está posicionada para uma rápida expansão. O capital apoiará a abertura de um novo escritório em São Francisco. Além disso, a startup planeja contratar mais de uma dezena de pessoas para preencher funções de engenharia e de entrada no mercado.
Conclusão
AgileRL representa uma tendência crescente no setor de IA: o retorno ao aprendizado por reforço para resolver problemas complexos que os grandes modelos de linguagem não conseguem lidar sozinhos. Ao fornecer uma plataforma acessível e pronta para uso como Arena, a startup está diminuindo a barreira de entrada para empresas que buscam implementar treinamento avançado de IA.
Com o forte apoio de investidores como a Fusion Fund e uma base de usuários que inclui algumas das maiores corporações do mundo, AgileRL está bem posicionada para capitalizar o interesse renovado no RL. A expansão planejada para São Francisco e o aumento de contratações sinalizam um compromisso com a escalabilidade de suas operações globalmente.
Conforme o cenário da IA continua a evoluir, a capacidade de combinar o poder estatístico dos transformers com o aprendizado passo a passo do aprendizado por reforço provavelmente definirá a próxima geração de aplicações de IA. AgileRL visa estar na vanguarda dessa convergência tecnológica.
"Após o lançamento do ChatGPT no final de 2022, as empresas moveram seus orçamentos do trabalho em RL para focar em transformers."
— Param Kumar, CEO da AgileRL
"Percebemos cedo que transformers são ótimos, mas são esses grandes modelos estatísticos."
— Param Kumar, CEO da AgileRL
"A realidade é que você precisará adicionar RL sobre isso, porque há apenas tanto que você pode inferir dos dados."
— Param Kumar, CEO da AgileRL




