Un lanceur d'alerte dénonce des fraudes et malversations présumées au sein du programme phare d'IA de Huawei
Au cœur des rêves brisés des ambitions chinoises en matière d'IA
Un membre clé du prestigieux laboratoire Noah's Ark de Huawei a publié des allégations détaillées faisant état de malversations généralisées, de plagiat et de malhonnêteté académique dans le développement des modèles de langage étendus Pangu, phares de l'entreprise.
Le témoignage du lanceur d'alerte anonyme, publié sur GitHub le 9 juillet 2025, offre un aperçu sans précédent de ce qu'il décrit comme « le cœur des ténèbres » au sein de l'un des géants technologiques les plus célébrés de Chine. Selon la lettre, les succès réputés de Huawei dans l'IA pourraient être bâtis sur des résultats falsifiés, de la propriété intellectuelle volée, et une culture qui « punit l'intégrité tout en récompensant la tromperie ».
L'« habillage » des modèles concurrents : la prétendue grande supercherie
Au cœur des allégations se trouve une pratique décrite comme le « shelling » – où Huawei aurait pris des modèles concurrents, y aurait apporté des modifications superficielles et les aurait présentés comme des développements propriétaires. Le lanceur d'alerte affirme que, sous la pression de fournir des résultats, une équipe dirigée par le « Wang Yunhe's Small Model Lab » aurait reconditionné le modèle Qwen-110B d'Alibaba, l'aurait légèrement modifié et l'aurait renommé « 135B V2 ».
Une analyse interne aurait révélé des preuves accablantes : une architecture non-concordante, des distributions de paramètres identiques à celles de Qwen et un code source contenant toujours des noms « Qwen ». Le lanceur d'alerte allègue que ce modèle a été déployé auprès de clients en aval et célébré en interne, malgré que de nombreux membres de l'équipe aient été « horrifiés » par la supercherie.
« Le modèle n'était pas seulement similaire – c'était littéralement Qwen avec un badge Huawei collé dessus », a déclaré à ce journaliste un chercheur en IA familier avec la situation, s'exprimant sous couvert d'anonymat par crainte de représailles. « Quiconque ayant les connaissances techniques pour examiner l'architecture pouvait voir la vérité. »
Fabrication de benchmarks : les scores parfaits qui ne pouvaient exister
Les allégations les plus préjudiciables concernent peut-être les benchmarks publiés par Huawei pour Pangu Ultra. Le lanceur d'alerte affirme que le rapport du modèle montrait une précision de 100 % mathématiquement impossible sur le benchmark ARC-Easy – un résultat immédiatement signalé comme « irréaliste ou fabriqué » par des experts externes.
D'anciens ingénieurs du laboratoire Noah's Ark de Huawei ont fourni une explication troublante : au lieu de tester sur des ensembles de données complets (environ 5 200 questions pour ARC-Easy), l'équipe n'a évalué que des sous-ensembles de 100 échantillons utilisés pour des vérifications rapides internes. Ces résultats partiels auraient été inclus dans le rapport public final sous la pression du temps, créant l'illusion de scores parfaits.
De plus, des benchmarks comme RACE ont été évalués en utilisant des méthodes simplifiées qui ont gonflé les scores jusqu'à 40 points par rapport aux méthodes traditionnelles basées sur la perplexité utilisées par les concurrents. Ces résultats gonflés ont ensuite été directement comparés aux scores d'autres modèles évalués avec des méthodes plus strictes – une comparaison trompeuse qui violait les normes académiques.
La détresse du lanceur d'alerte : « Du sang, de la sueur et des sacrifices »
La lettre révèle une dimension profondément personnelle au scandale. L'auteur décrit des années de travail acharné d'ingénieurs dévoués qui croyaient en la mission de Huawei de construire des alternatives nationales au matériel d'IA de NVIDIA. L'équipe aurait entraîné des modèles de plus en plus grands sur les NPU Ascend de Huawei, faisant face à des défis techniques importants.
Contrairement au 135B V2 prétendument plagié, le lanceur d'alerte affirme que le modèle 135B V3 (Pangu Ultra) a été « véritablement entraîné à partir de zéro » par leur équipe, en utilisant un tokeniseur raffiné et un pipeline d'entraînement amélioré. Ce modèle – décrit comme le « véritable produit du sang, de la sueur et des sacrifices » – a livré des performances compétitives avec « un entraînement propre et sans pics de perte », un exploit rare dans l'entraînement de grands modèles.
« Je peux accepter de mauvais résultats. Je ne peux pas accepter les résultats stupides », a déclaré un ancien ingénieur identifié comme « Blealtan », un doctorant de Tsinghua précédemment responsable de l'infrastructure MoE au laboratoire Noah's Ark.
Une culture de répression et de déliquescence bureaucratique
Lorsque les ingénieurs ont tenté de corriger les rapports de benchmark erronés, ils auraient été bloqués par la direction générale qui « craignait la réaction du public et préférait éviter tout amendement qui pourrait admettre des erreurs ». Le lanceur d'alerte décrit un environnement toxique où les équipes honnêtes s'épuisaient ou partaient, tandis que les acteurs malhonnêtes gagnaient en reconnaissance et en ressources.
Les listes d'auteurs pour les articles de recherche auraient été « curatées par la direction, et non basées sur les contributions réelles », certaines personnes découvrant que leurs noms avaient été ajoutés ou supprimés seulement après la publication des rapports. Le téléchargement des recherches sur des plateformes comme arXiv aurait été effectué par du personnel non-technique avec une contribution minimale des membres clés de l'équipe.
Les véritables enjeux : les ambitions chinoises en matière d'IA en jeu
Ces allégations surviennent à un moment critique pour le secteur chinois de l'IA, qui s'efforce de combler l'écart avec des concurrents américains comme OpenAI et Anthropic. Les modèles Pangu de Huawei sont au cœur des ambitions du pays en matière d'autosuffisance technologique au milieu des sanctions américaines en cours.
Les experts de l'industrie suggèrent que les malversations présumées de Huawei pourraient avoir été motivées par plus que la fierté. Certains soutiennent que l'objectif était d'utiliser des modèles externes plus performants pour prouver faussement que les puces Ascend de Huawei sont tout aussi capables que celles de NVIDIA pour l'entraînement de LLM de premier plan – aidant potentiellement Huawei à vendre du matériel intégré Pangu à des clients gouvernementaux et militaires.
Perspectives pour les investisseurs : gérer les conséquences
Pour les investisseurs qui suivent la course à l'IA en Chine, les allégations soulèvent des préoccupations importantes quant à l'état véritable des capacités d'IA nationales. Les analystes de marché suggèrent plusieurs implications potentielles :
Premièrement, les entreprises développant des technologies d'IA véritablement innovantes avec des pratiques de recherche transparentes pourraient émerger comme des investissements à long terme plus fiables. Des entreprises comme DeepSeek et Baidu, qui ont mis l'accent sur les approches open source et les benchmarks vérifiables, pourraient bénéficier d'un examen accru des affirmations en matière d'IA.
Deuxièmement, l'aspect matériel mérite une attention particulière. Si les puces Ascend de Huawei ont réellement des difficultés avec l'entraînement d'IA à grande échelle par rapport aux offres de NVIDIA, les entreprises de la chaîne d'approvisionnement qui soutiennent NVIDIA pourraient maintenir leur avantage concurrentiel plus longtemps que prévu.
Enfin, le scandale pourrait accélérer la surveillance réglementaire des rapports de benchmark d'IA en Chine, créant potentiellement des défis de conformité mais aussi des opportunités pour les entreprises offrant des services de vérification par des tiers.
« Ce à quoi nous assistons pourrait être un moment décisif pour le secteur chinois de l'IA », a noté un stratège en investissement technologique. « Le marché récompensera probablement la transparence et punira l'opacité à l'avenir. »
Avertissement : Cette analyse ne reflète que les conditions actuelles du marché et les indicateurs établis. Les performances passées ne garantissent pas les résultats futurs. Les lecteurs sont invités à consulter des conseillers financiers pour des conseils en investissement personnalisés.
Comme Huawei n'a pas encore officiellement répondu à ces allégations, le plein impact reste incertain. Ce qui est clair, cependant, c'est que sous les annonces brillantes et les benchmarks impressionnants de la révolution de l'IA en Chine, il pourrait y avoir bien plus de complexité – et de controverse – que ce qui était précédemment compris.