VoiceXML – Interaktywny Język Dialogów
VoiceXML (VXML) to język oparty na XML, przeznaczony do tworzenia interaktywnych dialogów między użytkownikami a komputerami. Działa analogicznie do HTML, umożliwiając rozwój aplikacji głosowych, które są interpretowane przez przeglądarki głosowe, podobnie jak HTML przez przeglądarki internetowe.
Funkcjonalności i Zastosowania
VoiceXML umożliwia użytkownikom interakcję z aplikacjami głosowymi za pośrednictwem połączeń telefonicznych. Obecnie istnieje wiele komercyjnych aplikacji VXML, które obsługują miliony połączeń dziennie, oferując różnorodne usługi, takie jak:
- Obsługa zamówień
- Zawiadomienia o wypadkach
- Budzenie
- Śledzenie lotów
- Głosowy dostęp do poczty elektronicznej
- Wybieranie głosowe
- Gazety audio
Struktura i Protokół
Dokumenty VoiceXML zawierają znaczniki, które instruują przeglądarki głosowe w zakresie syntezy dźwięku, rozpoznawania mowy i obsługi dialogów. Najczęściej stosowanym protokołem transportowym do pobierania stron VXML jest HTTP. Aplikacje mogą korzystać z dynamicznego generowania stron VXML za pomocą serwerów aplikacji, takich jak Tomcat czy Weblogic.
Standardy i Kompatybilność
Nowy standard W3C VoiceXML 2.0 ujednolica różnice w implementacji, a producenci muszą przechodzić rygorystyczne testy zgodności. Z VoiceXML współpracują także dwa inne standardy W3C:
- SSML – Język Znaczników Syntezy Mowy, umożliwiający „ubarwienie” dialogów.
- SRGS – Specyfikacja Gramatyczna Rozpoznawania Mowy, pomagająca w rozpoznawaniu wzorców słów.
Dodatkowym standardem jest CCXML, który służy do wstępnej konfiguracji połączeń pomiędzy dzwoniącym a przeglądarką głosową oraz w innych zastosowaniach.
Przykład Dokumentu VoiceXML
Poniżej znajduje się prosty przykład dokumentu VoiceXML:
Dokument ten, po interpretacji przez interpreter VoiceXML, pozwala usłyszeć syntetyzowany komunikat „Witaj świecie”.