E-Book, Deutsch, 361 Seiten, eBook
Reihe: Xpert.press
Zeeck Speech Application SDK mit ASP.NET
2005
ISBN: 978-3-540-28086-6
Verlag: Springer
Format: PDF
Kopierschutz: 1 - PDF Watermark
Design und Implementierung sprachgestützter Web-Applikationen
E-Book, Deutsch, 361 Seiten, eBook
Reihe: Xpert.press
ISBN: 978-3-540-28086-6
Verlag: Springer
Format: PDF
Kopierschutz: 1 - PDF Watermark
Zielgruppe
Professional/practitioner
Autoren/Hrsg.
Weitere Infos & Material
Vorbemerkungen.- Spracherkennung und Sprachsteuerung.- Das Speech Application SDK (SASDK).- Entwicklungshistorie.- Überblick über die Einsatzmöglichkeiten.- Installation und Anpassung.- Speech Controls im Visual Studio .NET.- Wizards, Editors und andere Tools.- Programmieren mit dem SASDK.- Sprachverarbeitung und Debugging.- Überprüfen von Eingaben.- Arbeiten mit Grammatiken.- Prompts und die Prompt-Datenbank.- Designkriterien und Best Practices.- Multimodale Applikationen.- Voice-only Applikationen.- Tuning, Tipps und Tricks.
12 Voice-only Applikationen (S. 285-286)
Voice-only Applikationen sind die „klassische" Umsetzung, wenn es um ausschließlich sprachgestützte Anwendungen geht. Während multimodale Anwendungen derzeit noch nicht so sehr verbreitet sind (aber ein sehr großes Potential bergen), werden Ihnen sicher viele aktuelle Beispiele einfallen, in denen Sie sich schon einmal mithilfe Ihrer Stimme oder per Telefontastatur mit einem Sprachcomputer „unterhalten" haben (oder unterhalten mussten) – entweder bei Buchungen und Reservierungen (Flug/Zug), bei Banktransaktionen oder Serviceanfragen von IT-Dienstleistern. Für den Nutzer dieser Dienste ist es wichtig, komfortabel, sicher und vor allem schnell zum gewünschten Ergebnis zu kommen, da diese Systeme meistens nur unter kostenpflichtigen Servicerufnummern betrieben werden.
12.1 Betrachtung unterschiedlicher Systemtypen
Bei der Entwicklung sprachgestützter Webapplikationen lässt sich keine Aussage über ein pauschales Konzept treffen, sozusagen eine Blaupause, die immer und überall einsetzbar ist. Dazu gibt es zu viele unterschiedliche Einflussfaktoren und entsprechend zahlreiche Varianten für eine Umsetzung. Ein Parameter muss jedoch als Grundlage für die zu entwickelnde Anwendung feststehen: Der Systemtyp, dessen Festlegung maßgeblich Einfluss auf die weitere Gestaltung hat. Nachfolgend werden die wesentlichen Systemtypen des Oberbegriffs „Voice-only Applikation" betrachtet.
Dual tone multi frequency (DTMF)
Anwender, die in Kontakt mit einem DTMF-Interface treten, haben in der Regel nur über das Tastentelefon (bzw. dessen Töne) die Möglichkeit, innerhalb der Anwendung zu navigieren. Geführt werden Sie durch Sprachausgaben mit einer natürlich oder – immer seltener – synthetisch klingenden Stimme.
Interactive voice response (IVR)
Diese Systeme werden meistens mit DTMF-Anwendungen gleichgesetzt, auch sie reagieren auf Tastentöne und erlauben manchmal zusätzlich die Eingabe von Sprachbefehlen. Ein IVR ist normalerweise die Vorstufe zu einem Callcenter, um einerseits vor der Weiterleitung an einen Agenten (Sachbearbeiter) gezielte Informationen zu kanalisieren und andererseits die Mitarbeiter sowie die Vermittlung zu entlasten.
Natural language (NL)
Natürlichsprachliche Dialogsysteme (Konversationssysteme) sind die bislang am weitesten entwickelte Form der Mensch-Maschine-Kommunikation auf sprachlicher Basis. Der größte Vorteil ist der – wie der Name bereits ausdrückt – natürliche Austausch von Informationen, genauer gesagt, die Art und Weise, wie Mensch und Maschine miteinander umgehen. Durch entsprechend umfangreiche Grammatikbibliotheken sind die NLSysteme (oder auch NDS) in der Lage, aus längeren Sätzen die relevanten Kerninformationen herauszufiltern und zu verarbeiten. Im Gegenzug wird der Anwender nicht mit stakkatoartigen Befehlen oder Ansagen konfrontiert, sondern ebenfalls mit umgangssprachlichen Sätzen. Die Aufzeichnungen sind oft sehr hochwertig und von professionellen Sprechern vorbereitet, was diese Systeme zusätzlich aufwertet.
Multimodal open microphone
Die Zukunft wird sicherlich in der Nutzung multimodaler Anwendungen unter Einsatz völlig freier, umgangssprachlicher Sätze bestehen, und zwar zu jeder Zeit an jedem Ort mit jedem sprach- und webtauglichen (mobilen) Gerät. Bislang scheitet die Umsetzung sowohl an den Bandbreiten als auch an den zur Verfügung stehenden Geräten, außerdem sind viele technische Voraussetzungen noch unklar, unter anderem Sicherheitsaspekte (security options), Personalisierung, Transaktionsverwaltung (transaction handling) oder auch Sitzungsmanagement (session management). Doch durch die rapide Entwicklung in diesen Segmenten – zum Beispiel im Bereich Voice over IP (VoIP) oder drahtlosen Netzen (WLANs) – und der zunehmenden Miniaturisierung wird es diese Systeme wohl in absehbarerer Zukunft zu erschwinglichen Preisen und in tragbaren Kleidungsstücken eingenäht geben, vielleicht die Killerapplikation der nächsten Jahre?