Après ChatGPT et DALL-E, voici VALL-E – l’IA de synthèse vocale qui peut simuler la voix de n’importe qui

Après ChatGPT et DALL-E, voici VALL-E – l’IA de synthèse vocale qui peut simuler la voix de n’importe qui

L’année dernière a vu l’émergence d’outils d’intelligence artificielle (IA) capables de créer des images, des illustrations ou même des vidéos à l’aide d’une invite de texte.

Il y a aussi eu de grands progrès Saisie IAavec ChatGPT d’OpenAI Cela a provoqué un émoi généralisé – et la peur – pour l’avenir de l’écriture.

Maintenant, quelques jours seulement après le début de 2023, un autre cas d’utilisation puissant de l’IA fait son apparition : un outil de synthèse vocale capable de simuler avec précision la voix d’une personne.

Développé par Microsoft, VALL-E peut enregistrer la voix d’une personne pendant trois secondes, boucler cette voix et convertir des mots écrits en discours, avec un ton et une émotion réalistes en fonction du contexte du texte.

Formé avec 60 000 heures d’enregistrements de discours en anglais, il peut prononcer un discours dans une « situation inutile », c’est-à-dire sans exemples précédents ni formation dans un contexte ou une situation donnée.

Présentation de VALL-E dans Article publié par l’Université CornellLes développeurs ont expliqué que les données d’enregistrement se composent de plus de 7 000 locuteurs uniques.

L’équipe affirme que le TTS a utilisé des centaines de fois plus de données que les systèmes TTS existants, ce qui les a aidés à surmonter le problème du non-paiement.

L’outil n’est actuellement pas disponible pour un usage public – mais il soulève des questions de sécurité, étant donné qu’il peut être utilisé pratiquement pour générer n’importe quel texte émanant de la voix de n’importe qui.

Microsoft parie gros sur l’intelligence artificielle

Cependant, il a perdu j’ai fait une offreaffiche un certain nombre d’invites de haut-parleur de trois secondes et une explication du processus de synthèse vocale en action, simulant correctement la voix.

READ  L'atterrisseur lunaire Peregrine termine les tests de pré-lancement

Avec l’invite du haut-parleur et la sortie VALL-E, vous pouvez comparer les résultats avec la « vérité terrain » – le locuteur réel lisant le texte instantané – et le résultat « terrain » de la technologie de synthèse vocale existante.

Microsoft a beaucoup investi dans l’intelligence artificielle et est l’un des bailleurs de fonds d’OpenAI, la société à l’origine de ChatGPT et de DALL-E, un outil de synthèse d’images ou d’art.

Le géant du logiciel a investi 1 milliard de dollars (930 millions d’euros) dans OpenAI en 2019, et un rapport publié cette semaine sur semafor.com indiquait qu’il envisageait d’investir 10 milliards de dollars supplémentaires (9,3 milliards d’euros) dans l’entreprise.

Valère Paget

"Fanatique maléfique de la télévision. Fier penseur. Wannabe pionnier d'Internet. Spécialiste de la musique. Organisateur. Expert de la culture pop hardcore."

Related Posts

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Read also x