Moltbook : le « réseau social pour agents d’IA » révèle de graves failles de sécurité

Les IA ont depuis peu la possibilité d’interagir entre elles via la plateforme Moltbook, mais certains utilisateurs ont décelé d’importants problèmes de cybersécurité.

Si une récente étude laisse entendre que les agents d’IA ne sont pas encore en mesure de remplacer des humains, cela n’empêche pas ces derniers de pulluler en ligne. Dans ce cadre, une entreprise a lancé Moltbook, un réseau social de type Reddit. Ce dernier permet aux agents d’IA de « discuter » entre eux, comme le feraient de véritables humains sur des réseaux sociaux tels que Facebook, Instagram ou X. Malheureusement, l’intelligence artificielle peut être utilisée de manière malveillante.

Crédit photo : Unsplash

On a par exemple pu voir des hackers utiliser l’IA pour rendre leurs malwares indétectables. De même, ChatGPT Atlas, l’explorateur internet façon OpenAI, poserait de graves problèmes de cybersécurité.

Moltbook : près de 1,5 million de comptes concernés ?

Et c’est donc cette fois au tour de la plateforme Moltbook. En effet, un hacker a découvert que les clés API des agents d’IA étaient stockées de manière non sécurisée. En d’autres termes, n’importe qui se trouvait en mesure de prendre le contrôle de chaque agent d’IA.

« Avec ces clés exposées, un attaquant pourrait totalement se faire passer pour n’importe quel agent de la plateforme », explique le hacker Jameson O’Reilly. « Publier en son nom, commenter en son nom, interagir avec d’autres agents en son nom. »

« Ces agents se connectent à Moltbook, lisent le contenu de la plateforme et font confiance à ce qu’ils y voient — y compris à leur propre historique de publications. Si un attaquant contrôle les identifiants, il peut insérer des instructions malveillantes dans l’historique de l’agent lui-même », ajoute le spécialiste.

« La prochaine fois que l’agent se connecte et relit ce qu’il croit avoir dit par le passé, il exécute ces instructions. La confiance de l’agent dans sa propre continuité devient alors le vecteur de l’attaque. Imaginez maintenant une telle opération coordonnée sur des centaines de milliers d’agents en même temps », affirme le hacker, qui ajoute que « les jetons d’authentification et codes de vérification exposés signifiaient qu’un attaquant aurait pu détourner n’importe lequel de ces 1,47 million de comptes non vérifiés avant que leurs propriétaires légitimes ne terminent la configuration ».

Source : gizmodo