Reddit : après Anthropic, le site porte plainte contre Perplexity pour utilisation illégale de données

Le célèbre site web communautaire semble protéger son contenu d’une manière acharnée. En effet, après avoir attaqué Anthropic, qui utiliserait le contenu de Reddit pour entraîner son IA, l’entreprise s’en prend maintenant à Perplexity.

L’ensemble des modèles d’IA ont besoin d’ingérer une grande quantité de contenu présent en ligne. Mais parfois, certaines entreprises vont trop loin. Certains artistes ont par exemple porté plainte contre OpenAI (ChatGPT), accusant cette dernière de violation de droits d’auteur. Pire encore, Meta (Facebook, Instagram, WhatsApp et Threads) aurait même utilisé des livres piratés pour former son IA. Et c’est donc cette fois au tour du célèbre forum Reddit, qui a déjà porté plainte contre Anthropic pour utilisation illégale de données.

Crédit photo : Unsplash

Cette fois-ci, Reddit s’attaque à plusieurs entreprises peu connues du grand public, à savoir SerApi, OxyLabs et AWMProxy. Mais ce n’est pas tout. En effet, Reddit porte également plainte contre la célèbre Anthropic, bien connue pour son IA destinée à concurrencer les géants du secteur, à savoir OpenAI (ChatGPT) et Google (Gemini).

Perplexity : Reddit contre-attaque

Pourtant, Perplexity aurait précédemment affirmé qu’elle n’utilisait pas directement les données de Reddit. Mais le site a ensuite indiqué que l’entreprise aurait créé des « posts test », ces derniers ne pouvant être explorés « que par le moteur de recherche Google et n’étaient accessibles nulle part ailleurs sur Internet ».

En réponse, Perplexity met en avant son droit à utiliser les données disponibles gratuitement sur le web. « Perplexity n’a pas encore reçu la plainte, mais nous défendrons toujours vigoureusement le droit des utilisateurs à accéder librement et équitablement à la connaissance publique », écrit l’entreprise d’IA. « Notre approche reste responsable et fondée sur des principes : nous fournissons des réponses factuelles grâce à une IA fiable, et nous ne tolérerons pas les menaces contre l’ouverture et l’intérêt public. »

Mais Reddit ne l’entend pas de cette oreille. La plainte affirme en effet que « la seule manière dont Perplexity a pu obtenir ce contenu Reddit et l’utiliser ensuite dans son moteur de réponses, c’est si lui-même et/ou ses coaccusés ont extrait les résultats de recherche Google pour y récupérer ce contenu Reddit, que Perplexity a ensuite rapidement intégré à son moteur de réponses. »

Source : Engadget