Un partenariat avec OpenAI permettra aux podcasteurs de reproduire leurs voix pour créer automatiquement des versions en langue étrangère de leurs émissions.
Spotify, la plateforme de streaming musical et de podcasts, vient d’annoncer une nouvelle fonctionnalité qui pourrait révolutionner le monde du podcasting. Il s’agit d’un système de clonage vocal basé sur l’intelligence artificielle, qui permettra aux podcasteurs de créer des versions multilingues de leurs émissions sans avoir à les enregistrer eux-mêmes.
Le système repose sur un partenariat avec OpenAI, la célèbre entreprise spécialisée dans l’IA, qui a développé une technologie de synthèse vocale appelée Neural Text-to-Speech (NTTS). Cette technologie est capable de générer des voix humaines à partir d’un texte, en imitant le timbre, l’accent, l’intonation et les émotions du locuteur original.
Spotify explique que les podcasteurs pourront utiliser cette fonctionnalité pour traduire leurs émissions dans d’autres langues, en conservant leur propre voix. Ainsi, ils pourront toucher un public plus large et plus diversifié, sans avoir à faire appel à des interprètes ou à des acteurs vocaux.
Pour utiliser le système, les podcasteurs devront d’abord donner leur consentement à Spotify pour que leur voix soit clonée. Ensuite, ils devront fournir une transcription écrite de leur émission dans leur langue maternelle. Le système se chargera alors de traduire le texte dans la langue cible, puis de le convertir en voix synthétique, en utilisant le modèle NTTS entraîné sur la voix du podcasteur.
Spotify affirme que le système respectera la vie privée et les droits d’auteur des podcasteurs, et qu’il indiquera clairement aux auditeurs qu’il s’agit d’une version synthétique. La plateforme précise également que le système n’est pas encore parfait, et qu’il peut présenter des erreurs ou des incohérences. Elle invite donc les podcasteurs à vérifier la qualité et la fidélité des versions générées avant de les publier.
Spotify n’a pas encore annoncé la date de lancement de cette fonctionnalité, ni les langues qui seront disponibles. Elle indique toutefois qu’elle compte la déployer progressivement auprès de ses créateurs partenaires, puis la rendre accessible à tous les podcasteurs qui le souhaitent.
À lire également :