Featherless.ai lève 20 millions pour démocratiser l'inférence serverless des modèles ouverts

Featherless.ai lève 20 millions d'AMD et Airbus pour déployer 30 000 modèles open source en inférence serverless sans infrastructure à gérer.

StartupsOpen SourceDéveloppeurs

Featherless.ai lève 20 millions pour démocratiser l'inférence serverless des modèles ouverts

La startup canadienne Featherless.ai vient de boucler un tour de table de 20 millions de dollars en Série A. AMD Ventures et Airbus Ventures co-dirigent le tour, aux côtés de BMW i Ventures, Kickstart Ventures et Wavemaker Ventures. L'objectif : rendre accessibles par API les 30 000 modèles open source disponibles sur Hugging Face, sans que les développeurs aient à gérer leur propre infrastructure.

Des racks de serveurs AMD dans un datacenter réaliste, avec le logo Featherless.ai visible sur l'écran de monitoring central, éclairage cinématographique terracotta en contrejour sur fond noir profond

Du hot-swapping pour 30 000 modèles

Featherless.ai a été fondée en 2023 par Eugene Cheah, Harrison Vanderbyl et Wesley George. La plateforme repose sur une technique de hot-swapping : les modèles sont chargés en mémoire GPU à la demande, en moins de cinq secondes, puis libérés dès qu'ils ne sont plus sollicités. Un seul pool de GPU peut ainsi servir des dizaines de modèles différents sans les maintenir tous actifs simultanément.

La plateforme supporte plus de 30 000 modèles ouverts couvrant le texte, la vision et l'audio. La startup se présente comme le partenaire d'inférence Hugging Face à la croissance la plus rapide. Côté facturation, elle adopte un forfait mensuel plutôt que la tarification au token, ce qui permet aux équipes de mieux anticiper leurs coûts sans payer des pics d'usage imprévus.

Cet accès simplifié à l'ensemble de l'écosystème open source prend tout son sens dans un contexte où les modèles ouverts captent une part croissante du trafic mondial : les données d'OpenRouter publiées en avril montraient déjà que les modèles chinois seuls représentaient 45 % du volume d'inférence sur les plateformes tierces.

AMD et Airbus : deux stratèges derrière le tour

La présence d'AMD Ventures en tête du tour n'est pas un hasard. Featherless s'engage à faire tourner tous ses modèles nativement sur AMD ROCm, l'environnement de calcul GPU du fabricant. L'objectif est de positionner les puces AMD comme une alternative crédible à NVIDIA pour l'inférence sur modèles ouverts, un marché en forte croissance sans domination encore établie.

L'intégration d'Airbus Ventures et BMW i Ventures dans le tour suggère que des usages industriels sont déjà explorés. Ces secteurs ont des contraintes fortes en matière d'audit et de traçabilité des données, deux avantages que les modèles ouverts peuvent offrir face aux solutions propriétaires des grands fournisseurs de cloud.

Le capital levé servira à étendre l'infrastructure mondiale, à lancer une place de marché de modèles spécialisés, et à approfondir les intégrations matérielles. L'ambition de construire une couche d'inférence indépendante rappelle, à une échelle différente, celle de Nscale, qui avait levé 1,7 milliard en mars pour une infrastructure IA souveraine en Europe.

Ce que ça signifie pour vous

Pour un développeur ou une équipe produit, Featherless représente une option directe pour accéder à n'importe quel modèle open source via API, sans déploiement propre ni gestion de GPU. Le forfait mensuel peut avantager les projets à usage régulier par rapport aux plateformes à la consommation. Le pari sur AMD ROCm mérite attention : si l'adoption s'accélère, la dépendance à NVIDIA pour l'inférence open source pourrait s'alléger, dans la continuité de ce que DeepSeek V4 a montré en tournant sur puces Huawei Ascend sans aucune puce NVIDIA.

Sources : Tech.eu · TechFundingNews · Featherless.ai · VKTR