Après avoir bouleversé le monde de l'image et de l'édition avec Photoshop, la firme américaine Adobe travaille actuellement au développement d'un logiciel similaire pour la voix.
Baptisé Project VoCo, l'outil ressemble de prime abord à n'importe-quel autre logiciel d'édition. Mais il dispose d’une particularité révolutionnaire : la possibilité de modifier une phrase à volonté en y ajoutant ou en y retirant des mots de manière quasi inaudible.
A lire aussi : Une intelligence artificielle arrive à prédire les verdicts des procès des droits de l’Homme
Un outil toujours en développement
Cette synthèse vocale du futur permet ainsi de générer de nouveaux mots qui semblent venir tout droit de la bouche de la personne qui les prononce, avec sa voix et sa tonalité, alors que celle-ci ne les a pas prononcés. La seule contrainte, à ce jour, est de disposer de vingt minutes d’enregistrement audio de la voix concernée.
«Nous avons développé une technologie permettant de taper simplement les mots que vous voulez changer dans la synthèse vocale», explique un porte-parole d'Adobe, cité par le site américain spécialisé dans l'actualité de technologie The Verge . «L’algorithme fait le reste et génère des mots qui semblent provenir de la personne d’origine», ajoute-t-il encore.
L’idée du programme a été présentée cette semaine par Adobe lors de sa conférence MAX. Il s’agit pour l’instant d’un projet en cours de développement, et dont l’idée est née d’une collaboration entre les laboratoires d’Adobe et l’université de Princeton.
Et si Adobe n’a pour l’instant pas donné de détails sur les possibles applications de ce projet, certains craignent déjà l'impact sur la sécurité qu’un tel outil pourrait avoir. D'autres voix se veulent en revanche plus rassurantes et soulèvent que de toute façon on ne peut déjà plus croire ce que l’on voit en image ou en vidéo. Par conséquent on ne pourra non plus accorder tout son crédit à ce qu’on entend.