
Positron AI lève 51,6 millions de dollars en série A pour des puces d'IA économes en mémoire qui surpassent NVIDIA
La jeune pousse Positron AI lève 51,6 millions de dollars pour contester la domination de NVIDIA dans l'IA
RENO, Nevada — Dans un ancien entrepôt d'un quartier de casinos, transformé en laboratoires étincelants, les ingénieurs de Positron AI assemblent discrètement ce qui pourrait devenir le prochain front de bataille pour la souveraineté technologique américaine : des puces informatiques spécialisées dans l'intelligence artificielle qui dépassent les performances du matériel NVIDIA standard de l'industrie tout en consommant une fraction de l'électricité.
La start-up a annoncé aujourd'hui avoir sécurisé un tour de financement de série A sursouscrit de 51,6 millions de dollars, portant sa levée de capitaux pour 2024 à plus de 75 millions de dollars. Cet investissement, mené par Valor Equity Partners, Atreides Management et DFJ Growth, représente l'une des plus importantes levées de fonds pour le matériel cette année dans un paysage de l'IA généralement dominé par les acteurs du logiciel.
Les Guerres de la Mémoire : Le Goulot d'Étranglement Caché de l'Infrastructure IA
Alors que les titres se concentrent souvent sur les capacités et les applications de l'IA, l'infrastructure critique qui alimente ces systèmes fait face à des défis croissants que peu de personnes en dehors de l'industrie mesurent pleinement. Les systèmes d'IA modernes nécessitent d'énormes ressources de mémoire, les plus grands modèles consommant des centaines de milliards de paramètres.
« Le véritable goulot d'étranglement n'est plus la puissance de calcul, c'est la bande passante mémoire », a fait remarquer un analyste de l'industrie qui suit les investissements dans l'infrastructure de l'IA. « C'est là que Positron a fait son pari stratégique. »
Le système Atlas de première génération de Positron, déjà livré aux clients, atteint un taux d'utilisation de la bande passante mémoire de 93 % contre seulement 10 à 30 % pour les architectures GPU conventionnelles. Cette efficacité permet au système de prendre en charge des modèles d'IA avec jusqu'à un demi-billion (500 milliards) de paramètres dans un seul serveur de 2 kW – une densité sans précédent qui pourrait modifier considérablement l'économie des centres de données.
David contre Goliath : S'attaquer à l'empire de l'IA de NVIDIA
Le marché du matériel d'IA, qui devrait atteindre 106,15 milliards de dollars en 2025 et croître de 19,2 % par an pour atteindre 254,98 milliards de dollars d'ici 2030, reste dominé par NVIDIA, qui contrôle plus de 80 % des puces d'IA pour centres de données. Le bastion du géant de Santa Clara a semblé inexpugnable, construit sur son écosystème logiciel CUDA mature et ses relations clients établies.
Pourtant, les chiffres de Positron racontent une histoire convaincante : Atlas offre une performance par dollar 3,5 fois supérieure et consomme 66 % d'énergie en moins que les puces H100 phares de NVIDIA. Pour les charges de travail d'inférence – où les modèles d'IA répondent à des requêtes plutôt que d'apprendre – Positron génère trois fois plus de jetons par watt.
« Nous n'essayons pas d'être tout pour tout le monde », a expliqué un cadre de Positron. « Nous avons ciblé un segment spécifique mais énorme : l'inférence pour les grands modèles linguistiques. C'est le segment de la pile d'IA qui connaît la croissance la plus rapide. »
Cette spécialisation a aidé Positron à obtenir des déploiements en production avec Cloudflare pour sa plateforme Workers AI et avec Parasail, validant ainsi sa technologie dans des scénarios réels au-delà des bancs d'essai de laboratoire.
Renaissance du silicium américain dans un contexte de tensions géopolitiques
Contrairement à de nombreuses start-ups de matériel d'IA qui dépendent entièrement de la fabrication asiatique, Positron met l'accent sur sa chaîne d'approvisionnement fabriquée aux États-Unis. Les puces de l'entreprise sont fabriquées dans les usines de TSMC en Arizona et assemblées sur le territoire national – une décision stratégique qui s'aligne sur les incitations politiques américaines au titre de la loi CHIPS et atténue les risques d'exportation géopolitiques.
Cet accent mis sur la production nationale trouve un écho auprès des clients potentiels des industries réglementées et des secteurs gouvernementaux où la souveraineté de la chaîne d'approvisionnement est importante. Un document interne sur les projets, consulté par des journalistes, suggère que Positron recherche des intégrateurs fédéraux ayant des liens avec le Département de la Défense par le biais de programmes de recherche sur l'innovation pour les petites entreprises.
La voie à suivre : Des FPGA au silicium personnalisé
Le produit Atlas actuel de Positron utilise des circuits intégrés programmables sur site (FPGA) —