Meta piocherait dans des milliers de livres “sans valeur” pour entraîner son IA Par David Laurent le 21 avril 2025 L’intelligence artificielle a besoin d’énormément de données pour s’entraîner, c’est bien connu. Mais Meta serait allé trop loin, en utilisant une large bibliothèque de livres protégés par des droits d’auteur. Suite au succès mondial rencontré par ChatGPT, d’innombrables entreprises se sont lancées dans la course à l’IA, pour le meilleur comme pour le pire. En effet, certaines entreprises n’hésitent pas à collecter du contenu pourtant protégé par des droits d’auteur. On a par exemple pu voir plusieurs artistes poursuivre OpenAI et Meta pour cette même raison. Même l’auteur de Game of Thrones, George R.R. Martin, a poursuivi OpenAI en justice. Crédit photo : Unsplash Meta semble ainsi ne pas déroger à la règle, l’entreprise de Mark Zuckerberg étant accusée d’avoir utilisé des livres piratés afin de former son IA. Dans le cadre de ce procès mené par un groupe d’auteurs, Meta a reconnu les faits : l’entreprise propriétaire de Facebook, Instagram et WhatsApp a bien utilisé plus de sept millions de livres de la bibliothèque pirate LibGen pour former son IA. Meta : une méthode partagée par Google et OpenAI ? Mais, pour sa défense, Meta a affirmé que cette initiative constituait une « utilisation équitable » du matériel, et n’était donc pas illégale. De plus, l’entreprise affirme que les livres en question n’ont que peu de valeur économique. « Pour qu’il y ait un marché, il faut qu’il y ait quelque chose de valeur à échanger, » aurait ainsi déclaré l’entreprise de Mark Zuckerberg. « Mais aucune des œuvres [des auteurs] n’a de valeur économique, individuellement, en tant que données d’entraînement. » À lire > ChatGPT : OpenAI ne veut pas payer pour utiliser vos données De plus, Meta ne se serait pas inquiétée de l’utilisation des œuvres piratées sur LibGen pour une raison simple : ses concurrents en feraient de même. Un message interne dévoilé au cours du procès affirme que, lorsqu’un employé a demandé si cette initiative était légale ou non, un autre salarié aurait répondu : « Je n’ai pas posé de questions, mais c’est ce que fait OpenAI avec GPT-3, ce que fait Google avec PALM et ce que fait DeepMind avec Chinchilla, alors nous le ferons aussi. » Source : futurism La rédaction vous conseille : Meta aurait utilisé des livres piratés afin de former son IA Llama 4 : Meta aurait menti quant aux performances réelles de son IA Meta : Mark Zuckerberg veut développer une IA dix fois plus puissante que Llama 3 Article précédent Gemini 2.5 : la dernière IA de Google pourrait présenter des “risques sérieux” en matière de sécurité avril 18, 2025 Article suivant Bluesky rejoint X (Twitter) grâce à ce nouvel ajout de taille avril 22, 2025