Meta piocherait dans des milliers de livres “sans valeur” pour entraîner son IA

L’intelligence artificielle a besoin d’énormément de données pour s’entraîner, c’est bien connu. Mais Meta serait allé trop loin, en utilisant une large bibliothèque de livres protégés par des droits d’auteur.

Suite au succès mondial rencontré par ChatGPT, d’innombrables entreprises se sont lancées dans la course à l’IA, pour le meilleur comme pour le pire. En effet, certaines entreprises n’hésitent pas à collecter du contenu pourtant protégé par des droits d’auteur. On a par exemple pu voir plusieurs artistes poursuivre OpenAI et Meta pour cette même raison. Même l’auteur de Game of Thrones, George R.R. Martin, a poursuivi OpenAI en justice.

Meta semble ainsi ne pas déroger à la règle, l’entreprise de Mark Zuckerberg étant accusée d’avoir utilisé des livres piratés afin de former son IA. Dans le cadre de ce procès mené par un groupe d’auteurs, Meta a reconnu les faits : l’entreprise propriétaire de Facebook, Instagram et WhatsApp a bien utilisé plus de sept millions de livres de la bibliothèque pirate LibGen pour former son IA.

Meta : une méthode partagée par Google et OpenAI ?

Mais, pour sa défense, Meta a affirmé que cette initiative constituait une « utilisation équitable » du matériel, et n’était donc pas illégale. De plus, l’entreprise affirme que les livres en question n’ont que peu de valeur économique. « Pour qu’il y ait un marché, il faut qu’il y ait quelque chose de valeur à échanger, » aurait ainsi déclaré l’entreprise de Mark Zuckerberg. « Mais aucune des œuvres [des auteurs] n’a de valeur économique, individuellement, en tant que données d’entraînement. »

De plus, Meta ne se serait pas inquiétée de l’utilisation des œuvres piratées sur LibGen pour une raison simple : ses concurrents en feraient de même. Un message interne dévoilé au cours du procès affirme que, lorsqu’un employé a demandé si cette initiative était légale ou non, un autre salarié aurait répondu : « Je n’ai pas posé de questions, mais c’est ce que fait OpenAI avec GPT-3, ce que fait Google avec PALM et ce que fait DeepMind avec Chinchilla, alors nous le ferons aussi. »

Source : futurism