PaperGeek, actu geek et high tech

Actu geek

  •  Tendances
  • Codes secrets Netflix
  • Disney Plus
  • Xbox Series X
  • PS5
  • News
    • Apps et Logiciels
      • Mac
      • Mobile
      • PC
    • Bons plans
    • Culture Geek
    • Guide d’achat
    • Hardware
    • Insolite
    • Jeux video
    • Mobilité
    • Objets connectés
    • Opérateurs télécom
    • Sécurité
    • Science
    • Sport
    • Transport
    • Web
  • Comment faire
Accueil / Apps et Logiciels / Google : cette nouvelle IA est capable de générer des bruitages pour vos vidéos

Google : cette nouvelle IA est capable de générer des bruitages pour vos vidéos

Par David Laurent le 19 juin 2024

Google DeepMind vient de dévoiler V2A, une IA capable d’analyser une vidéo, puis d’en générer l’intégralité de la bande son. L’utilisateur peut également fournir des instructions écrites afin d’affiner le résultat.

L’IA est déjà capable de générer des vidéos. On pense notamment à Sora, un puissant générateur de vidéos développé par OpenAI (ChatGPT). Google a rapidement contre-attaqué en lançant Veo, une IA semblable à celle proposée par OpenAI. Mais la plupart de ces IA se contentent de générer des images, sans pour autant proposer la bande son qui va avec. Dans ce cadre, DeepMind, une sous-division de Google, vient de lancer une IA vouée à générer des sons en s’appuyant sur des vidéos. Celle-ci peut alors générer des bruitages, des effets sonores et même du doublage.

Loup
Crédit photo : Google

DeepMind affirme que son nouveau système peut générer « un nombre illimité de bandes sonores pour n’importe quelle entrée vidéo« . L’utilisateur peut simplement exprimer ses préférences afin d’affiner le travail de l’IA. Celui-ci peut, par exemple, écrire “moins de bruits de fond” ou encore “plus de bruit de voiture”.

V2A : une technologie loin d’être parfaite

L’un des points forts de cette nouvelle IA, baptisée V2A (Video To Audio), est sans doute le fait qu’elle est capable de synchroniser le son et l’image, une tâche habituellement plutôt fastidieuse pour les monteurs vidéos. DeepMind précise ainsi : « En s’entraînant sur la vidéo, l’audio et les annotations supplémentaires, notre technologie apprend à associer des événements audio spécifiques à diverses scènes visuelles, tout en répondant aux informations fournies dans les annotations ou les transcriptions« .

Toutefois, DeepMind va devoir affiner son IA, qui, pour l’instant, est loin d’être parfaite. En effet, la qualité audio de sortie dépend de la fidélité de l’entrée vidéo, et l’IA peut être perturbée par certains éléments à l’écran. Par conséquent, la génération de doublages et leur synchronisation peuvent parfois poser problème.

DeepMind précise ainsi : « V2A tente de générer de la parole à partir des transcriptions d’entrée et de la synchroniser avec les mouvements des lèvres des personnages. Mais le modèle de génération de vidéo jumelée peut ne pas être conditionné par les transcriptions. Cela crée un décalage, qui se traduit souvent par une synchronisation labiale étrange”.

Source : digitaltrends

Article précédent

Ce magnifique clip de type Pixar généré par l’IA défraie la chronique, les emplois des animateurs menacés ?

juin 17, 2024

Animation
Article suivant

OpenAI : un ancien responsable de l’entreprise lance sa propre société afin de créer une IA « superintelligente »

juin 20, 2024

Lignes de code
Notifications

Abonnez-vous pour recevoir les notifications sur smartphone, tablette ou pc selon vos préférences !

Newsletter

Abonnez-vous et recevez nos dernières actus & bons plans directement dans votre boite email.

Vérifiez votre boite de réception ou votre répertoire d’indésirables pour confirmer votre abonnement.

Barre latérale 1

Derniers articles
  • Tilly Norwood : l’actrice générée par l’IA va avoir droit à son propre « univers »
    Tilly Norwood : l’actrice générée par l’IA va avoir droit à son propre « univers »
    Tilly Norwood, une « actrice » créée de toutes pièces par l’intelligence artificielle, va avoir droit à davantage de profondeur. Ses créateurs ont en effet annoncé le lancement d’un «…

    Il y a 2 heures et 46 minutes

    Apps et Logiciels, Cinéma, Séries et TV

  • ChatGPT Health : l’IA médicale d’OpenAI serait incroyablement dangereuse en cas d’urgence
    ChatGPT Health : l’IA médicale d’OpenAI serait incroyablement dangereuse en cas d’urgence
    Plus tôt cette année, OpenAI lançait ChatGPT Health, une IA censée proposer des conseils médicaux. Mais, en cas d’urgence, celle-ci aurait tendance à conseiller aux utilisateurs de rester chez eux…

    Il y a 1 jour et 3 heures

    Apps et Logiciels, Santé, Web

  • Intelligence artificielle : des chercheurs confient les codes nucléaires à une IA, le résultat est inquiétan
    Intelligence artificielle : des chercheurs confient les codes nucléaires à une IA, le résultat est inquiétan
    Des chercheurs ont fictivement confié la décision de lancer une attaque nucléaire à plusieurs IA. Certaines d’entre elles, dont le GPT-4 d’OpenAI, ont recommandé l’utilisation de l’arme atomique. L’intelligence artificielle…

    Il y a 4 jours et 3 heures

    Apps et Logiciels, Sécurité

  • OpenAI : le Canada demande des comptes au créateur de ChatGPT
    OpenAI : le Canada demande des comptes au créateur de ChatGPT
    Le gouvernement canadien vient de convoquer des responsables d’OpenAI. Le créateur de ChatGPT est accusé de ne pas avoir prévenu les forces de l’ordre dans le cadre d’une fusillade de…

    Il y a 5 jours et 3 heures

    Apps et Logiciels, Sécurité, Web

Newsletter Papergeek

Inscrivez-vous et recevez gratuitement nos meilleures actus !

Vérifiez votre boite de réception ou votre répertoire d’indésirables pour confirmer votre abonnement.

© 2026 papergeek.fr : actus geek et high tech

  • Préférences cookies
  • Nous Contacter
  • Mentions légales
  • confidentialité
  • CGU
loading gif ×
Notifications

Recevoir les notifications

Réglages

Actualité
Bon plan