Ключевые факты
- AgileRL привлекла $7,5 млн венчурных инвестиций во главе с Fusion Fund.
- Платформа стартапа Arena использует обучение с подкреплением (RL) для обучения моделей ИИ.
- Программное обеспечение было скачано более 300 000 раз и используется Airbus, IBM и JPMorgan.
- Сооснователи — Парам Кумар и Николас Устаран-Андерегг (2023 год).
- Компания планирует открыть офис в Сан-Франциско и нанять более дюжины сотрудников.
Краткое содержание
Лондонский стартап AgileRL привлек $7,5 млн венчурных инвестиций для расширения своей платформы программного обеспечения для обучения ИИ. Компания была основана в 2023 году Парамом Кумаром и Николасом Устаран-Андереггом.
AgileRL специализируется на обучении с подкреплением (RL) — методе обучения ИИ, при котором системы учатся, пробуя различные действия и улучшая результат на основе обратной связи. Несмотря на то, что эта технология восходит к 1950-м годам, в настоящее время она переживает возрождение в лабораториях ИИ.
Стартап создал платформу под названием Arena. Это программное обеспечение позволяет инженерам и специалистам по данным помещать свои модели ИИ в симуляции, тонко настраивать их перед развертыванием и отслеживать их работу.
По данным компании, платформа была скачана более 300 000 раз. В настоящее время она используется такими крупными корпорациями, как Airbus, IBM и JPMorgan.
Инвестиционный раунд возглавил Fusion Fund, в котором также участвовали Flying Fish, Octopus Ventures, Entrepreneur First и Counterview Capital. AgileRL планирует использовать привлеченный капитал для открытия офиса в Сан-Франциско и найма более дюжины сотрудников на инженерные и рыночные позиции.
Платформа Arena и детали финансирования
AgileRL обеспечила $7,5 млн венчурных инвестиций для ускорения разработки своего программного обеспечения. Стартап, базирующийся в Лондоне, стремится упростить для бизнеса сложный процесс обучения ИИ.
Основой их предложения является платформа под названием Arena. Она разработана как комплексная среда, в которой разработчики могут управлять полным жизненным циклом модели ИИ. В частности, Arena позволяет пользователям:
- Загружать модели ИИ в платформу
- Запускать симуляции
- Тонко настраивать модели перед развертыванием
- Отслеживать модели во время их активной работы
Компания утверждает, что их решение ускоряет разработку ИИ, поскольку инструменты для обучения объединены в одном месте и доступны «с полки». Это контрастирует с альтернативой — созданием собственной лаборатории ИИ с нуля, что часто требует больших ресурсов.
Что касается бизнес-модели, AgileRL предлагает бесплатный тариф, который предоставляет пользователям доступ к ограниченному количеству кредитов для обучения. Для более крупных потребностей доступны платные тарифы для бизнеса и профессионалов, а также индивидуальные лицензии для корпораций.
Переход к обучению с подкреплением
AgileRL делает ставку на обучение с подкреплением (RL) — метод, корни которого восходят к 1950-м годам. В отличие от других методологий ИИ, RL предполагает, что системы учатся шаг за шагом, пробуя действия и улучшая результат на основе полученной обратной связи.
Парам Кумар, генеральный директор AgileRL, пролил свет на текущие рыночные тенденции в области технологий обучения ИИ. Он отметил значительный сдвиг после запуска ChatGPT в конце 2022 года.
«После запуска ChatGPT в конце 2022 года компании перенаправили свои бюджеты с работы над RL на фокусировку над трансформерами», — заявил Кумар. Трансформеры — это технология, лежащая в основе больших языковых моделей, которая изучает закономерности из больших наборов данных одновременно.
Однако Кумар считает, что отрасль осознает ограничения этого подхода. «Теперь, говорит он, все больше компаний понимают, что трансформеры могут привести их только до определенной точки». Он объяснил, что, хотя трансформеры великолепны, по сути, это большие статистические модели.
Кумар подробно рассказал о необходимости комбинирования технологий: «Реальность такова, что вам придется добавить RL поверх этого, потому что из данных можно извлечь только определенный объем информации».
Практическое применение и рост
Чтобы проиллюстрировать практическое применение обучения с подкреплением, Парам Кумар привел конкретный пример, связанный с робототехникой. Он описал сценарий, в котором роботизированная рука должна переместить мяч с одного стола на другой.
Кумар объяснил, что это движение не является одиночным действием и может быть разбито на множество более мелких задач. К ним относятся захват мяча, поднятие руки и перемещение сустава. Он отметил, что платформа AgileRL позволяет инженерам задавать параметры для улучшения этих конкретных задач.
Стартап добился значительного распространения с момента своего основания. Платформа была скачана более 300 000 раз. Она также привлекла высокопоставленных корпоративных клиентов, с использованием которой подтвердили такие компании, как Airbus, IBM и JPMorgan.
Благодаря $7,5 млн венчурному раунду во главе с Fusion Fund, AgileRL находится в авангарде быстрого расширения. Капитал поддержит открытие нового офиса в Сан-Франциско. Более того, стартап планирует нанять более дюжины человек для заполнения инженерных и рыночных вакансий.
Заключение
AgileRL представляет собой растущую тенденцию в секторе ИИ: возвращение к обучению с подкреплением для решения сложных задач, которые большие языковые модели не могут решить в одиночку. Предоставляя доступную, готовую к использованию платформу, такую как Arena, стартап снижает порог входа для компаний, стремящихся внедрить передовое обучение ИИ.
Имея сильную поддержку инвесторов, таких как Fusion Fund, и базу пользователей, включающую некоторые из крупнейших корпораций мира, AgileRL находится в прекрасном положении, чтобы воспользоваться возобновившимся интересом к RL. Планы по расширению в Сан-Франциско и увеличение найма сигнализируют о приверженности масштабированию их операций в глобальном масштабе.
По мере развития ландшафта ИИ способность сочетать статистическую мощь трансформеров с пошаговым обучением с подкреплением, вероятно, определит следующее поколение приложений ИИ. AgileRL намерена быть на переднем крае этого технологического схождения.
«После запуска ChatGPT в конце 2022 года компании перенаправили свои бюджеты с работы над RL на фокусировку над трансформерами».
— Парам Кумар, генеральный директор AgileRL
«Мы рано осознали, что трансформеры великолепны, но это большие статистические модели».
— Парам Кумар, генеральный директор AgileRL
«Реальность такова, что вам придется добавить RL поверх этого, потому что из данных можно извлечь только определенный объем информации».
— Парам Кумар, генеральный директор AgileRL




