Enfin une synthèse vocale qui ne craint pas

Spread the love
  • Yum

Enfin une synthèse vocale qui ne craint pas

Nous avons entamé le 21e siècle depuis deux décennies, les voitures commencent littéralement à voler, les vacances dans l’espace sont à portée de main… et pourtant, les ordinateurs ressemblent toujours à des parodies de robots désorientés lorsqu’on leur demande de convertir du texte en parole (text-to-speech, ou TTS). Allez, les développeurs, il doit y avoir une meilleure solution.

Une société appelée WellSaid Labs pense en avoir une, et elle est en train de recevoir un coup de pouce grâce à une série A.

« Tout simplement, WellSaid est l’avenir de la création de contenu pour la voix. C’est pourquoi des milliers de clients adorent utiliser le produit quotidiennement, avec une adoption ascendante hors normes. Matt et Michael ont réuni une équipe de classe mondiale, et nous ne pourrions pas être plus ravis de faire partie de l’aventure WellSaid », affirme Cameron Borumand, associé général chez FUSE, qui a mené le tour de table.

Allons droit au but : vous pouvez écouter des échantillons des voix ici.

publicité

Une richesse d’échantillons de voix

Il s’agit de l’un des grands défis de l’intelligence artificielle, et d’un sujet de recherche considérable dans des domaines tels que l’informatique, l’interface homme-machine et la robotique. En juin 2020, selon un communiqué, la synthèse vocale de WellSaid Labs est devenue la première à atteindre la parité humaine pour le naturel, sur de courts clips audio, à travers plusieurs voix.

« Nous avons ajouté AI Voice à la boîte à outils de milliers de créateurs de contenu et de leurs équipes », explique Matt Hocking, PDG de WellSaid Labs. « Notre AI Voice à parité humaine peut être produite en temps réel et mise à jour à la demande. Ouvrir de nouvelles et passionnantes opportunités pour “ajouter de la voix” n’avait jamais été perçu comme possible auparavant. AI Voice garantit facilement que chaque production peut être créée et mise à jour efficacement à l’échelle. »

L’étape de la parité humaine a des implications importantes sur la façon dont le contenu audio est créé, ce qui a incité les investisseurs à sauter à bord. Les cas d’utilisation comprennent les services de streaming, la radio, la publicité programmatique, le marketing numérique et les contenus de formation d’entreprise. WellSaid Labs dispose d’une bibliothèque d’avatars vocaux qui donne accès à de nombreux styles et tons de lecture. En outre, les marques peuvent créer leurs propres avatars AI Voice afin de capturer la ressemblance, le style et le caractère unique de la voix nécessaires pour raconter leurs histoires.

« Les créateurs de contenu ou les concepteurs d’expérience produit étaient auparavant confrontés à des compromis difficiles entre qualité et évolutivité lorsqu’ils utilisaient des outils TTS ou une voix-off humaine. Les voix incroyables de WellSaid, accessibles par le biais d’une application studio ou d’une API évolutive, éliminent la nécessité de choisir entre une voix naturelle et réaliste et un contenu vocal évolutif à l’infini et facilement modifiable. WellSaid fournit les deux et les livre de la manière dont votre équipe souhaite les consommer », indique James Newell, de Voyager Capital. « Pour les équipes créatives, ça a été extrêmement utile pour produire plusieurs éléments de contenu de haute qualité, dans une voix cohérente, en quelques heures au lieu de plusieurs semaines. »

Source : ZDNet.com

Leave a Reply

%d bloggers like this: