В эпоху стремительного развития искусственного интеллекта компании сталкиваются с серьезной проблемой: как убедиться в надежности и эффективности AI-приложений? Лондонский стартап Composo предлагает инновационное решение этого вопроса.
Революционный подход к оценке AI
Composo разработал уникальную систему мониторинга приложений на базе больших языковых моделей (LLM). В отличие от конкурентов, таких как Agenta, Freeplay, Humanloop и LangSmith, компания предлагает как no-code решение, так и API, делая свой продукт доступным как для разработчиков, так и для бизнес-пользователей.
Как работает технология
Система Composo комбинирует модель вознаграждения, обученную на предпочтительных результатах работы AI, с набором специфических критериев для каждого приложения. Например, для медицинского чат-бота можно установить проверку симптомов, требующих особого внимания, и система будет оценивать, насколько последовательно приложение выполняет эту задачу.
Достижения и перспективы
Несмотря на относительно скромное финансирование в $2 млн, Composo уже привлек таких клиентов как Accenture, Palantir и McKinsey. По словам CEO Себастьяна Фокса, компания не стремится к привлечению сотен миллионов долларов, так как их подход не требует значительных капиталовложений.
Влияние на российский рынок
Для российского рынка появление подобной технологии может иметь существенное значение. Локальные компании, внедряющие AI-решения, получат возможность более эффективно оценивать качество работы своих AI-приложений, что особенно важно в таких чувствительных областях, как финансы, здравоохранение и безопасность.
Конкурентные преимущества
Composo выделяется на рынке благодаря своей гибкой системе оценки и накопленному опыту работы с экспертными данными. Компания также позиционирует себя как решение, готовое к работе с агентным AI, что может стать ключевым преимуществом в будущем.
Стартап продолжает развиваться, планируя расширение инженерной команды и усиление R&D-направления. Это может стать важным шагом в решении проблемы надежности AI-приложений, особенно для предприятий, где репутационные риски имеют критическое значение.