Buch, Deutsch, Band 141, 143 Seiten, Format (B × H): 170 mm x 244 mm, Gewicht: 289 g
Reihe: Informatik-Fachberichte
Buch, Deutsch, Band 141, 143 Seiten, Format (B × H): 170 mm x 244 mm, Gewicht: 289 g
Reihe: Informatik-Fachberichte
ISBN: 978-3-540-17998-6
Verlag: Springer Berlin Heidelberg
Das Buch behandelt die Worterkennung in kontinuierlicher Sprache, eine im Rahmen des automatischen Verstehens gesprochener Sprache auftretende und im Gegensatz zur Einzelworterkennung auch heute noch nicht vollständig gelöste Aufgabenstellung. Nach einer einführenden vereinheitlichenden Darstellung einschlägiger Techniken des Mustervergleichs (String Matching, Dynamic Time Warping, Hidden Markov Modelling) für die Erkennung isoliert gesprochener Wörter werden die Ansätze verallgemeinert, so daß Wörter auch in fließender Rede ohne a priori Kenntnis der Wortgrenzen lokalisierbar sind. Mehrere alternative Modelle zur Beschreibung von Lautähnlichkeiten sowie Verfahren zur Gütebewertung der erzeugten Worthypothesen stehen dann im Zentrum der weiterführenden Überlegungen. Im experimentellen Teil ist der Aufbau eines konkreten Systems zur Generierung von Worthypothesen beschrieben, das den Rahmen bildet für die nachfolgenden vergleichenden Untersuchungen, in deren Verlauf bekannte und vom Autor neu entwickelte Verfahren einander kritisch gegenübergestellt werden. Der Leser findet in dem Buch etwa zu gleichen Teilen kritische Aufarbeitung der Standardmethoden, neue Verfahren und die Beschreibung praktischer Erfahrungen bei der Anwendung der Worterkennungsalgorithmen auf große Datenmengen. Anwendungen des Dargestellten sind nicht nur im engeren Bereich der Automatischen Spracherkennung denkbar. Auch in Gegenstandsbereichen, in denen Strukturen sequentiell-linearer Beschaffenheit, etwa zeitabhängiger Muster, eine Rolle spielen, kommt eine Lösung von Klassifikations- und Lokalisierungsproblemen mit Hilfe der beschriebenen Ansätze in Betracht.
Zielgruppe
Research
Autoren/Hrsg.
Weitere Infos & Material
1. Einführung.- 1.1 Generierung von Worthypothesen.- 1.2 Übersicht.- 2. Vergleich von Zeitmustern.- 2.1 Abstand zwischen Zeichenketten.- 2.2 Dynamische Zeitverzerrung.- 2.3 Markoffmodelle.- 3. Positionierung von Wörtern im Sprachsignal.- 3.1 Detektion von Schlüsselwörtern.- 3.2 Einige Verfahren zur Positionierung.- 3.3 Vertikale Summation.- 3.4 Invertiertes Markoffmodell (IMM).- 4. Lautähnlichkeit und -verwechslung.- 4.1 Ähnlichkeitsrelationen zwischen Lauten.- 4.2 Lautverwechslungswahrscheinlichkeiten.- 4.3 Lautoberklassen.- 4.4 Lautverwechslungsmatrix nach Regeln.- 5. Ein Modul zur Generierung von Worthypothesen.- 5.1 Die Repräsentation des Lexikons als Baum.- 5.2 Eine parametrisierte Familie von Worterkennungsalgorithmen.- 5.3 Performanzkriterien für die Worthypothesengenerierung.- 6. Experimente und Resultate zur Worterkennung.- 6.1 Übersicht und experimentelle Voraussetzungen.- 6.2 Das erweiterte Markoffmodell (EMM).- 6.3 Einige Modifikationen zum EMM.- 6.4 Einige Vergleichsalgorithmen.- 6.5 Lautverwechslungsmatrizen.- 6.6 Wortposition.- 6.7 Separierte Auswertungen.- 6.8 Lexikon.- 6.9 Performanzvergleich.- 7. Hypothesenbewertung.- 7.1 Problemstellung.- 7.2 Verletzung des Optimalitätsprinzips.- 7.3 Längennormalisierung.- 7.4 Das Zweiklassenproblem für Worthypothesen.- 7.5 Die Bewertungsfunktion für das IMM.- 7.6 Wortfolgen und ihre Bewertung.- Zusammenfassung.- Bibliographie.