|
|
- C
- CCXML :
-
Call Control eXtensible Markup Language est une extension du standard XML pour les applications vocales en VoiceXML. Il permet de développer une interface aux navigateurs vocaux.
- Corpus :
-
Enregistrement de mots et phrases utilisé pour concevoir un modèle de langage.
- D
- Dialogue :
-
Description de la navigation sur le serveur vocal, la rédaction des messages, les navigations en cas d'erreur ou de besoin de confirmation, les scripts utilisés en cas de gestion de données, et la description des grammaires de réponses à chacun des messages du dialogue.
- DTMF :
-
Les codes DTMF (dual-tone multi-frequency) sont les combinaisons de fréquences utilisées pour la téléphonie moderne (c'est-à-dire pas à impulsions).
Ces codes sont utilisés pour la composition des numéros de téléphones, et ils ont permis la création des premiers serveurs vocaux interactifs.
- G
- Grammaire :
-
Les grammaires sont des descriptions (formelles ou statistiques) des phrases qui vont être prononcées par les utilisateurs, elles sont nécessaires dans les portails à reconnaissance vocale destinés au grand public pour transcrire la parole de locuteurs différents.
- M
- MRCP :
-
MRCP (Media Resource Control Protocol) est un protocole publié par l'IETF qui permet aux serveurs vocaux d'utiliser les services étendus de reconnaissance ou synthèse.
- R
- Reconnaissance vocale :
-
La reconnaissance vocale ou reconnaissance automatique de la parole (Automatic Speech Recognition ASR) est une technologie informatique qui permet d'analyser un mot ou une phrase captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine.
La reconnaissance vocale, ainsi que la synthèse vocale, l'identification du locuteur ou la vérification du locuteur, font partie des technologies de traitement de la parole. Ces technologies permettent notamment de réaliser des interfaces vocales c'est à dire des interfaces homme-machine (IHM) où une partie de l'interaction se fait à la voix.
Parmi les nombreuses applications, on peut citer les applications de dictée vocale sur PC où la difficulté tient à la taille du vocabulaire et à la longueur des phrases, mais aussi les applications téléphoniques de type serveur vocal interactif, où la difficulté tient plutôt à la nécessité de reconnaître n'importe quelle voix dans des conditions acoustiques variables et souvent bruyantes (téléphones mobiles dans des lieux publics).
- S
- SVI :
-
Un Serveur Vocal Interactif (en anglais IVR pour Interactive Voice Response) est un système informatique permettant aux utilisateurs d'obtenir des réponses ou d'effectuer des transactions depuis un téléphone.
Les requêtes sont faites soit en DTMF (en utilisant les touches du téléphone) soit en reconnaissance de la parole. Les résultats sont formulés vocalement par concaténation de fichiers vocaux ou par synthèse vocale.
Le VoiceXML langage reconnu par le W3C, a standardisé les développements et redonné une forte impulsion à ces systèmes.
- Synthèse vocale :
-
La synthèse vocale est une technique informatique de synthèse sonore qui permet de créer de la parole artificielle à partir de n'importe quel texte.
Pour obtenir ce résultat, elle s'appuie à la fois sur des techniques de traitement linguistique, notamment pour transformer le texte orthographique en une version phonétique prononçable sans ambiguïté, et sur des techniques de traitement du signal pour transformer cette version phonétique en son numérisé écoutable sur un haut parleur.
Il s'agit, comme la reconnaissance vocale, d'une technologie permettant de construire des interfaces vocales. Parmi les applications, on peut citer la vocalisation d'écrans informatiques pour les malvoyants (screenreader, ou lecteur d'écran), ainsi que de nombreuses applications de serveurs vocaux téléphoniques, comme les annuaires vocaux de grande taille, où la synthèse vocale est la seule technique viable pour permettre la restitution sonore des noms et des adresses des abonnés.
- T
- Tuning :
-
La phase pendant laquelle les enregistrements permettent d'affiner un service vocal, en vérifiant les expressions et mots prononcés par les utilisateurs.
- V
- VoiceXML :
-
Le VoiceXML (Voice eXtensible Markup Language ou langage de balisage extensible vocal) est un langage normalisé de programmation d'une application vocale.
Basé sur la norme XML, il permet de développer un service vocal sans passer par un langage propriétaire.
Pour en savoir plus : WikiPedia
- X
- XML :
-
XML (eXtensible Markup Language ou langage de balisage extensible) est un langage informatique favorisant l'échange d'informations sur Internet et défini par le W3C.
Son objectif initial est de permettre l'interopérabilité en facilitant l'échange contenus entre systèmes d'informations hétérogènes.
De nombreux langages respectent la syntaxe XML : XHTML, XSLT, VoiceXML ...
Pour en savoir plus : WikiPedia
|
|
Rejoignez la communauté du vocal
|
|
|