
Le double discours de Reddit sur les données : Le Front du Peuple vend les données du Peuple
Reddit : le grand écart sur ses données
Imaginez construire une agora mondiale de la liberté d'expression, puis faire payer l'entrée quand les voisins viennent frapper à la porte. C'est le dernier coup de théâtre de Reddit à l'ère de l'IA.
NEW YORK – Imaginez : Reddit, ce vaste bazar en ligne où l'on déballe des secrets, échange des mèmes et enflamme des débats sans fin, protège soudainement ses portes comme un videur jaloux. La plateforme, autrefois synonyme de discussion ouverte, vient de signer de juteux contrats pour céder son trésor de discussions d'utilisateurs à des géants de l'IA comme Google et OpenAI. Et maintenant ? Elle poursuit un concurrent qui a siphonné le même contenu sans s'acquitter des droits.
C'est d'un tribunal de Manhattan que jaillit l'audacieuse offensive de Reddit contre Perplexity, une jeune pousse de l'IA qui fournit des réponses rapides. La plainte fustige Perplexity pour ce que Reddit qualifie de "raid numérique massif". Selon l'entreprise, cette start-up, ainsi qu'un réseau discret de sociétés de "scraping", ont contourné les protections de Reddit pour aspirer des années de publications et de discussions. C'est le carburant brut pour entraîner des robots intelligents.
En y regardant de plus près, on découvre une délicieuse ironie qui résume bien notre ère numérique défaillante. Reddit s'est érigé en forum public animé d'Internet, prospérant grâce aux pépites brutes et non éditées de ses bénévoles. Pourtant, le voici, les poings levés, affirmant que ces pépites ne sont pas un bien commun, mais une marchandise de choix pour les vendeurs avisés. La règle est simple : ce qui est un partenariat rémunéré pour l'un est une escroquerie pure et simple pour l'autre, même si les deux produisent des IA qui imitent notre intelligence de manière étrangement similaire. La différence ? De l'argent sonnant et trébuchant, pas une intention astucieuse.
Oubliez les notes de bas de page sur les droits d'auteur ou les lois poussiéreuses comme le DMCA – cette querelle est le signe de secousses plus importantes dans les guerres de territoire de l'IA. Des avocats avisés et des vétérans des conseils d'administration murmurent qu'il s'agit d'une manœuvre de pouvoir pour anéantir le trafic souterrain de données qui a financé le boom. Reddit ne s'arrête pas à Perplexity ; il traîne aussi ses complices devant la justice – pensez à Oxylabs en Lituanie, SerpApi au Texas, et même AWMProxy, une entité louche liée à d'anciens essaims de bots russes. C'est comme incendier l'ensemble de la chaîne d'approvisionnement du marché noir, pas seulement l'acheteur final.
Le message de Reddit est clair : fini le festin à la table illimitée du web sans payer la note. L'accès exige une addition salée, point final. Et, ma foi, ils ont des preuves pour étayer leurs fanfaronnades.
Le piège de l'appâtage
Reddit ne se contente pas de grands discours. Leur dossier décrit un jeu du chat et de la souris très astucieux. En mai dernier, ils ont envoyé une note sévère à Perplexity, exigeant l'arrêt de ces pratiques. Le pillage a-t-il diminué ? Non. Les mentions de fragments de Reddit dans les réponses de Perplexity ont en fait grimpé en flèche, comme un défi ignoré.
Alors, les magiciens de la technologie de Reddit ont concocté un stratagème classique, tiré des thrillers d'espionnage. Ils ont tendu un "piège à miel" (honeypot) – une fausse publication nichée dans un recoin de Google, scellée aux regards indiscrets. Boum. Quelques heures plus tard, Perplexity recrachait ses "entrailles" dans une réponse. C'est la preuve irréfutable : des détours sournois via des proxies intermédiaires, et non de simples "coups d'œil polis".
Perplexity riposte avec une noble grandiloquence, brandissant l'étendard d'un web sans entraves – l'étincelle même qui avait allumé la mèche de Reddit il y a des décennies. Ils n'ont pas encore vu les documents, disent-ils, mais jurent de protéger "l'ouverture et le bien public" tout en servant des faits clairs. C'est un choc de croyances : la connaissance comme un fleuve impétueux, ou un réservoir fermé ? Le hic ? La fièvre de Reddit pour la protection de ses "frontières" n'a frappé qu'après l'arrivée de ces juteux paiements, couronnés par un pacte annuel de 60 millions de dollars (environ 55 millions d'euros / 55 millions de francs suisses) avec Google en février dernier.
Un trader de données perspicace l'a bien compris : "Ils ont gravé une ligne de faille dans les puces. Payez comme Google ou OpenAI, et vous êtes tiré d'affaire. Économisez, et vous êtes le méchant. Mêmes données, mêmes astuces – il manque juste le 'ping' de la banque.""
Briser le coffre-fort du code
Sur le plan juridique, Reddit évite l'épineux imbroglio des allégations de "copie" alimentées par l'IA – ces flous du "fair use" qui embrouillent les juges. Au lieu de cela, ils se concentrent sur les règles anti-contournement strictes du DMCA. Il ne s'agit pas de voler des notes ; il s'agit de forcer la porte pour les dérober.
Les tribunaux ont longtemps sévi contre le franchissement de fossés numériques, comme les labyrinthes CAPTCHA ou les boucliers pare-feu. Bien plus clair que les débats sur le "trop emprunté ?". En se concentrant sur les soi-disant contournements de Perplexity – ignorant les panneaux "interdit" de robots.txt, se dissimulant via des essaims de proxys – Reddit ramène la querelle des idées floues aux piratages concrets.
Une victoire rapide en justice, et les répercussions pourraient submerger les laboratoires d'IA du monde entier. Les coûts s'envolent ; les risques se multiplient pour tout bot qui se gave de données brutes du web sans autorisation. Soudain, les gardiens – des vieilles bibliothèques de clips et des agences de presse aux revues scientifiques et aux dépôts de code – détiennent un réel levier. Ils négocient âprement pour leur savoir-faire humain, cette sève que l'IA convoite. Les grandes plateformes avec des revendications en béton et des barrières solides s'enrichissent ; les petits codeurs qui considéraient le web ouvert comme un terrain de jeu équitable ? Ils sont en pleine confusion.
Cet affrontement redessine la frontière sauvage du web. D'un côté : Reddit, enfant de l'anarchie. De l'autre : Perplexity, colportant la sagesse pour les masses. En jeu ? Notre déluge numérique – des milliards de répliques, de photos, d'étincelles. Héritages partagés de la conscience collective, ou pétrole brut pour les moteurs de demain, mûr pour être exploité par les plus riches extracteurs ?
Pendant que les dossiers s'empilent dans ce palais de justice digne de Gotham, les vrais scribes – ces Redditors du quotidien qui ont créé des héros, hurlé de rire, partagé leurs peines, tissé des tribus pendant deux décennies – se retirent en spectateurs. Leur refrain ? Il s'avère que c'est un bien immobilier de premier choix. Maintenant, tout le monde se demande : dans quel porte-monnaie résonnera la manne ?