Class Central is learner-supported. When you buy through links on our site, we may earn an affiliate commission.

Amazon Web Services

Build a Serverless Text-to-Speech Application with Amazon Polly (Français)

Amazon Web Services and Amazon via AWS Skill Builder

Overview

Coursera Plus Monthly Sale: All Certificates & Courses 40% Off!
Après le 28 mars, les titres des cours seront en anglais uniquement. Cependant, les descriptions des cours resteront disponibles dans la langue de votre choix pour vous permettre de faire des recherches dans cette langue.

Présentation de l’atelier

En général, la synthèse vocale n’est pas facile à réaliser. On ne peut partir du principe que, lorsqu’une application lit chaque lettre d’une phrase, le résultat a un sens. Voici quelques difficultés courantes pour les applications de synthèse vocale :

  • Mots qui s’écrivent de la même manière, mais qui se prononcent différemment, par exemple en anglais I live in Las Vegas par rapport à This presentation broadcasts live from Las Vegas.
  • Normalisation du texte : clarification des abréviations, des acronymes et des unités : St. peut faire référence à Street ou à Saint.
  • Conversion du texte en phonèmes dans les langues à mappage complexe, par exemple en anglais tough, through et though. Dans cet exemple, les parties similaires des différents mots peuvent se prononcer différemment selon le mot et le contexte.
  • Les mots français utilisés en anglais (déjà vu), les noms propres (François Hollande) et l’argot (ASAP, LOL).

Amazon Polly offre une fonctionnalité de synthèse vocale qui parvient à surmonter ces difficultés, ce qui vous permet de vous concentrer sur la création d’applications qui utilisent la synthèse vocale au lieu de résoudre les problèmes d’interprétation.

Amazon Polly transforme un texte en parole. Amazon Polly vous permet de créer des applications qui parlent naturellement et de concevoir de nouvelles catégories de produits vocaux. Amazon Polly est un service d’IA Amazon qui exploite des technologies avancées d’apprentissage profond pour synthétiser la parole de façon naturelle. Il comprend des douzaines de voix réalistes dans plus de 20 langues. Vous pouvez ainsi sélectionner la voix idéale et créer des applications vocales qui fonctionnent dans de nombreux pays différents.

De plus, Amazon Polly offre les temps de réponse toujours rapides nécessaires pour prendre en charge des dialogues interactifs en temps réel. Vous pouvez mettre en cache et enregistrer les fichiers audio Polly pour les rejouer ou les redistribuer en mode hors connexion. En d’autres termes, ce que vous convertissez et enregistrez est à vous. Il n’existe pas de frais supplémentaires concernant l’utilisation de la synthèse vocale. Polly est également facile à utiliser. Vous n’avez qu’à envoyer le texte que vous souhaitez convertir en parole à l’API Amazon Polly. Amazon Polly renvoie immédiatement le flux audio à votre application afin qu’elle puisse le lire directement ou le stocker sous un format de fichier audio standard, comme le MP3.

Dans cet atelier, vous allez créer une application serverless de base qui utilise Amazon Polly pour convertir du texte en parole. L’application dispose d’une interface utilisateur simple qui accepte du texte dans de nombreuses langues, puis le convertit en fichiers audio que vous pouvez lire dans votre navigateur web. Cet atelier utilise des articles de blog, mais vous pouvez vous servir de n’importe quel type de texte. Par exemple, lisez des recettes pendant que vous cuisinez, ou bien des articles de journaux ou des livres pendant que vous conduisez ou que vous roulez en vélo.

Objectifs

À la fin de cet atelier, vous devriez pouvoir :

  • créer une table Amazon DynamoDB pour stocker des données ;
  • créer une API RESTful Amazon API Gateway ;
  • créer des fonctions AWS Lambda déclenchées par API Gateway ;
  • connecter les fonctions AWS Lambda à Amazon Simple Notification Service (SNS) ;
  • utiliser Amazon Polly pour synthétiser de la parole dans de nombreuses langues et voix différentes.

Signification des icônes

De nombreuses icônes sont utilisées dans cet atelier pour attirer l’attention sur différents types d’instructions et de remarques. La liste suivante explique la signification de chaque icône :

  • Commande : commande que vous devez exécuter.
  • Sortie attendue : exemple de sortie que vous pouvez utiliser pour vérifier la sortie d’une commande ou d’un fichier modifié.
  • Remarque : indice, directive ou conseil important.
  • Attention : information présentant un intérêt spécial ou d’une importance particulière (pas assez importante pour causer des problèmes pour l’équipement ni les données si vous n’y faites pas attention, mais susceptible de vous amener à devoir répéter certaines étapes).
  • Avertissement : action irréversible et susceptible d’avoir une incidence sur l’échec d’une commande ou d’un processus (y compris les avertissements concernant les configurations ne pouvant pas être modifiées après leur mise en place).
  • Tâche terminée : une conclusion ou un récapitulatif de l’atelier.

Reviews

Start your review of Build a Serverless Text-to-Speech Application with Amazon Polly (Français)

Never Stop Learning.

Get personalized course recommendations, track subjects and courses with reminders, and more.

Someone learning on their laptop while sitting on the floor.