Fellbaum | Sprachverarbeitung und Sprachübertragung | E-Book | www.sack.de
E-Book

E-Book, Deutsch, 406 Seiten

Reihe: Computer Science and Engineering (German Language)

Fellbaum Sprachverarbeitung und Sprachübertragung


2. Auflage 2012
ISBN: 978-3-642-31503-9
Verlag: Springer
Format: PDF
Kopierschutz: 1 - PDF Watermark

E-Book, Deutsch, 406 Seiten

Reihe: Computer Science and Engineering (German Language)

ISBN: 978-3-642-31503-9
Verlag: Springer
Format: PDF
Kopierschutz: 1 - PDF Watermark



In dem Standardwerk der Informationsverarbeitung werden nicht nur die elektroakustischen und nachrichtentechnischen Grundlagen dargestellt, auch die Sprache als menschliche Kommunikationsform wird aus linguistischer und physiologischer Perspektive beschrieben. Berücksichtigt wird dabei neben der Theorie stets die Anwendung - auf dem neuesten Stand der Technik. Die 2. Auflage bietet neue Abschnitte zu den Grundzügen der Signalanalyse und zu Sprachdialogsystemen. Audiobeispiele und multimediale Vortragselemente zum Download auf extras.springer.com.

Prof. Dr.-Ing. Klaus Fellbaum, Jahrgang 1942, studierte Elektrotechnik (Nachrichtentechnik) an den Technischen Universitäten Hannover und Berlin. Von 1971  bis 1975 war er wissenschaftlicher Mitarbeiter am Forschungsinstitut der AEG-Telefunken in Ulm und auf dem Gebiet der elektronischen Sprachsignalverarbeitung tätig. 1975 promovierte er über Sprachcodierverfahren. Daran anschließend war er Oberingenieur am Lehrstuhl für Nachrichtentechnik der Universität Dortmund und wurde 1977 als Professor an die TU Berlin, Fachgebiet Digitale Übertragungstechnik berufen. Von 1994 bis 2007 war er Lehrstuhlinhaber für Kommunikationstechnik an der BTU Cottbus.

Fellbaum Sprachverarbeitung und Sprachübertragung jetzt bestellen!

Autoren/Hrsg.


Weitere Infos & Material


1;Vorwort zur 2. Auflage;6
2;Vorwort zur 1. Auflage;7
3;Inhaltsverzeichnis;9
4;Kapitel-1;14
4.1;Grundzüge der Linguistik;14
4.1.1;1.1 Zum Sprachbegriff;14
4.1.2;1.2 Sprache als Zeichensystem semiotische Aspekte;20
4.1.3;1.3 Sprache als Kommunikationsform;23
4.1.4;1.4 Informationstheoretische Aspekte;25
4.1.5;Literatur;30
5;Kapitel-2;31
5.1;Grundzüge der Schallausbreitung und Elektroakustik;31
5.1.1;2.1 Schallfeld, Schallausbreitung;31
5.1.1.1;2.1.1 Schallfeldgrößen, Ausbreitungsformen;31
5.1.1.2;2.1.2 Grundgleichungen der Schallausbreitung;33
5.1.1.3;2.1.3 Wellengleichung;36
5.1.1.4;2.1.4 Ebene Schallabstrahlung;37
5.1.1.4.1;2.1.4.1 Lösung der Wellengleichung für den ebenen Fall;37
5.1.1.4.2;2.1.4.2 Größen zur Kennzeichnung des ebenen Schallfeldes;39
5.1.1.4.3;2.1.4.3 Pegeldefinitionen;41
5.1.1.4.4;2.1.4.4 Pegelrechnung;41
5.1.1.5;2.1.5 Ebene Wellenausbreitung in Röhren;43
5.1.1.6;2.1.6 Kugelförmige Schallausbreitung;47
5.1.1.6.1;2.1.6.1 Lösung der Wellengleichung;47
5.1.1.6.2;2.1.6.2 Wichtige Kenngrößen für die kugelförmige Schallausbreitung;48
5.1.1.6.3;2.1.6.3 Kugelförmige Schallabstrahlung in Abhängigkeit von der Frequenz;50
5.1.1.6.4;2.1.6.4 Kugelförmige Schallabstrahlung in Abhängigkeit von der Entfernung;53
5.1.1.6.5;2.1.6.5 Schallfluss einer Kugelwelle;53
5.1.1.6.6;2.1.6.6 Gebündelte Schallabstrahlung;54
5.1.1.7;2.1.7 Webstersche Gleichung;55
5.1.2;2.2 Elektroakustische Wandler;60
5.1.2.1;2.2.1 Einteilungsprinzipien, Definitionen;60
5.1.2.2;2.2.2 Elektrodynamische Wandler;61
5.1.2.3;2.2.3 Elektrostatische Wandler;63
5.1.2.4;2.2.4 Elektret-Mikrofone;66
5.1.2.5;2.2.5 Weitere Mikrofontypen;67
5.1.2.5.1;2.2.5.1 Piezoelektrische Mikrofone;67
5.1.3;Literatur;68
6;Kapitel-3;69
6.1;Grundzüge der Phonetik und Darstellungsmöglichkeiten von Sprachsignalen;69
6.1.1;3.1 Entwicklungsgeschichtliches zur Funktion des Sprechens und Hörens;69
6.1.2;3.2 Sprachproduktion;70
6.1.2.1;3.2.1 Atmung;70
6.1.2.2;3.2.2 Stimmproduktion (Phonation);71
6.1.2.3;3.2.3 Artikulation;74
6.1.3;3.3 Lautklassifikation;74
6.1.3.1;3.3.1 Konsonanten;74
6.1.3.2;3.3.2 Vokale (Selbstlaute);76
6.1.4;3.4 Zur Klassifikation von Einzellauten;78
6.1.5;3.5 Lautschriftsysteme;80
6.1.6;3.6 Weitere phonologische Begriffe;81
6.1.7;3.7 Modelle für die Spracherzeugung;83
6.1.8;3.8 Darstellungsmöglichkeiten von Sprachsignalen;89
6.1.8.1;3.8.1 Zeitfenster;89
6.1.8.2;3.8.2 Darstellung im Zeitbereich;91
6.1.8.3;3.8.3 Darstellung im Frequenzbereich;93
6.1.9;3.9 Signaleigenschaften von Einzellauten;97
6.1.9.1;3.9.1 Konsonanten;98
6.1.9.2;3.9.2 Vokale;101
6.1.10;3.10 Koartikulationseffekte;106
6.1.11;3.11 Langzeitmessung von Sprache;106
6.1.12;Literatur;109
7;Kapitel-4;111
7.1;Hörphysiologie und Psychoakustik;111
7.1.1;4.1 Hörphysiologie;111
7.1.1.1;4.1.1 Überblick;111
7.1.1.2;4.1.2 Außenohr;112
7.1.1.3;4.1.3 Mittelohr;113
7.1.1.4;4.1.4 Innenohr;114
7.1.1.5;4.1.5 Zum Hörvorgang Hörhypothesen;117
7.1.2;4.2 Grundzüge der Psychoakustik;119
7.1.2.1;4.2.1 Hörfläche, Lautstärke, Lautheit;119
7.1.2.2;4.2.2 Frequenzgruppen;124
7.1.2.3;4.2.3 Pegelzuwachs bei mehreren Schallereignissen;127
7.1.2.4;4.2.4 Mithörschwelle, Verdeckungseffekt;130
7.1.2.5;4.2.5 Lautstärkebestimmung bei breitbandigen Schallereignissen Zwicker-Diagramm;132
7.1.2.6;4.2.6 Tonhöhenwahrnehmung;133
7.1.2.6.1;4.2.6.1 Gerade wahrnehmbare Frequenzänderungen (JNVF);135
7.1.2.6.2;4.2.6.2 Verhältnistonhöhe;135
7.1.3;Literatur;137
8;Kapitel-5;139
8.1;Sprachqualitätsmessungen;139
8.1.1;5.1 Zum Begriff der Sprachqualität;139
8.1.2;5.2 Dimensionen der Sprachqualität;140
8.1.3;5.3 Formen der Sprachqualitätsmessung und Anwendungen;142
8.1.3.1;5.3.1 Sprachqualitätsmessungen im Überblick;142
8.1.3.2;5.3.2 Skalierungs- und Antwortformen bei Sprachqualitätsmessungen;144
8.1.3.2.1;5.3.2.1 Arten von Skalen;144
8.1.3.2.2;5.3.2.2 Antwortformen;145
8.1.3.3;5.3.3 Anwendungen von Sprachqualitätsmessungen;145
8.1.4;5.4 Auditive Verfahren zur Beurteilung der Sprachqualität;146
8.1.4.1;5.4.1 Überblick;146
8.1.4.2;5.4.2 Randbedingungen bei auditiven Messungen;146
8.1.4.3;5.4.3 Globale Qualitätsbewertung;151
8.1.4.3.1;5.4.3.1 Absoluter Qualitätsbewertungstest (Absolute Category Rating Test, ACR-Test);152
8.1.4.3.2;5.4.3.2 Paarvergleichstests;155
8.1.4.4;5.4.4 Diagnostische Qualitätsbewertung;158
8.1.4.4.1;5.4.4.1 Verständlichkeitstests;158
8.1.4.4.2;5.4.4.2 Verständlichkeitstests für Wörter;166
8.1.4.4.3;5.4.4.3 Verständlichkeitstests für Sätze;166
8.1.4.4.4;5.4.4.4 Prosodietest;168
8.1.4.5;5.4.5 Weitere Verfahren von auditiven Tests;168
8.1.5;5.5 Instrumentelle Verfahren zur Beurteilung der Sprachqualität;169
8.1.5.1;5.5.1 Nutzen und Einteilungsprinzipien;169
8.1.5.2;5.5.2 Einseitig gerichtete Sprachkommunikation (Hörsituation);171
8.1.5.2.1;5.5.2.1 Verfahren mit Referenzsignal;172
8.1.5.2.2;5.5.2.2 Verfahren ohne Referenzsignal;179
8.1.5.3;5.5.3 Planung und Qualitätsbeurteilung von Fernsprechnetzen das E-Modell;180
8.1.5.4;5.5.4 Zusammenstellung der wichtigsten ITU-T-Standards für auditive und instrumentelle Sprachqualitätsmessungen;181
8.1.6;Literatur;183
9;Kapitel-6;185
9.1;Sprachcodierverfahren;185
9.1.1;6.1 Einleitung;185
9.1.2;6.2 Analoge und digitale Darstellung von Signalen;186
9.1.3;6.3 Einteilung der Sprachcodierverfahren;187
9.1.4;6.4 Signalformcodierung;188
9.1.4.1;6.4.1 Pulscodemodulation (PCM);188
9.1.4.2;6.4.2 Differenz-Puls-Code-Modulation (DPCM);201
9.1.4.2.1;6.4.2.1 Zum Prinzip der Linearen Prädiktion;201
9.1.4.2.2;6.4.2.2 Zur Problematik der Fehlerrückkopplung;210
9.1.4.3;6.4.3 Adaptive Differenz-Pulscodemodulation (ADPCM);211
9.1.4.3.1;6.4.3.1 Kovarianz-Methode;212
9.1.4.3.2;6.4.3.2 Autokorrelationsmethode;214
9.1.4.4;6.4.4 Lineare Prädiktion und inverse Filterung;219
9.1.5;6.5 Parametrische Verfahren;226
9.1.5.1;6.5.1 Grundprinzip;226
9.1.5.2;6.5.2 Kanalvocoder;227
9.1.5.3;6.5.3 Linearer Prädiktionsvocoder (LPC-Vocoder);228
9.1.5.4;6.5.4 LPC-Vocoder Realisierung;230
9.1.5.5;6.5.5 Grundfrequenzanalyse (GFA);233
9.1.6;6.6 Hybride Codierung;244
9.1.6.1;6.6.1 Grundprinzip;244
9.1.6.1.1;6.6.1.1 Langzeit- und Kurzzeitprädiktion;245
9.1.6.1.2;6.6.1.2 Vektorquantisierung;245
9.1.6.1.3;6.6.1.3 „Analyse-durch-Synthese“-Prinzip;248
9.1.6.2;6.6.2 Restsignal-Codierung (RELP Residual Excited Linear Prediction);249
9.1.6.3;6.6.3 CELP;249
9.1.7;6.7 Frequenzbereichscodierung;253
9.1.7.1;6.7.1 Transformationscodierung;253
9.1.7.2;6.7.2 Teilbandcodierung (Subband Coding);254
9.1.7.3;6.7.3 MPEG-basierteAudiocodierung;255
9.1.8;6.8 Internationale Standards und Ausblick;258
9.1.9;Literatur;261
10;Kapitel 7;262
10.1;Merkmalextraktion und Klassifikation;262
10.1.1;7.1 Vorbetrachtung;262
10.1.2;7.2 Merkmalextraktion;263
10.1.2.1;7.2.1 Linear Predictive Cepstral Coding (LPCC);264
10.1.2.2;7.2.2 Mel-Frequency Cepstral Coefficients (MFCCs);264
10.1.2.3;7.2.3 Perceptual Linear Predictive (PLP)-Analyse;269
10.1.2.4;7.2.4 RASTA-Perceptual Linear Predictive (RASTA-PLP)-Verfahren;269
10.1.3;7.3 Klassifikation;270
10.1.4;7.4 Entscheidungstheoretische Klassifikation;271
10.1.4.1;7.4.1 Prinzip der Bayes-Klassifikation;271
10.1.4.2;7.4.2 Statistische Klassifikatoren mit bekannten Wahrscheinlichkeitsverteilungen;279
10.1.5;7.5 Lineare Klassifikatoren;281
10.1.6;7.6 Abstandsklassifikatoren;282
10.1.7;7.7 Hidden-Markov-Modelle;284
10.1.7.1;7.7.1 Vorbetrachtung: Markov-Modelle;284
10.1.7.2;7.7.2 Hidden-Markov-Modelle;286
10.1.8;7.8 Künstliche Neuronale Netze;293
10.1.8.1;7.8.1 Einführung;293
10.1.8.2;7.8.2 Struktur künstlicher neuronaler Netze;294
10.1.8.3;7.8.3 Beispiel für eine neuronale Anwendung: ADALINE;296
10.1.8.4;7.8.4 Perzeptron;300
10.1.8.5;7.8.5 Netzstrukturen;301
10.1.8.6;7.8.6 Multilayer Perzeptron (MLP);302
10.1.8.6.1;Forward Pass;304
10.1.8.6.2;Fehlerberechnung;304
10.1.8.6.3;Backward Pass;304
10.1.8.6.4;Ausgangsschicht;305
10.1.8.6.5;Interne Schicht;305
10.1.9;7.9 DTW-Klassifikator;306
10.1.9.1;7.9.1 Dynamische Zeitnormalisierung;306
10.1.10;Literatur;311
11;Kapitel-8;313
11.1;Spracheingabe;313
11.1.1;8.1 Vorbetrachtung;313
11.1.2;8.2 Spracherkennung;314
11.1.2.1;8.2.1 Spracherkennung beim Menschen;314
11.1.2.2;8.2.2 Überblick;316
11.1.2.3;8.2.3 Einteilung der Verfahren;316
11.1.2.4;8.2.4 Erkennung als mathematische Optimierungsaufgabe;319
11.1.2.5;8.2.5 Einzelwort-Erkennung;321
11.1.2.5.1;8.2.5.1 Prinzipielle Vorgehensweise;321
11.1.2.5.2;8.2.5.2 Spracherkennung mit Hidden-Markov-Modellen;323
11.1.2.5.3;8.2.5.3 Einzelwort-Erkennung mit neuronalen Netzen;324
11.1.2.5.4;8.2.5.4 Akustisch-phonetische Erkennung;325
11.1.2.6;8.2.6 Beurteilung der Erkennungsleistung;326
11.1.2.7;8.2.7 Schlüsselwort-Erkennung („Word Spotting“);328
11.1.2.8;8.2.8 Erkennung fortlaufender Sprache;330
11.1.3;8.3 Sprechererkennung;334
11.1.3.1;8.3.1 Übersicht;334
11.1.3.2;8.3.2 Sprecherverifizierung;335
11.1.3.3;8.3.3 Verifizierung auf der Basis von akustisch-phonetischen Merkmalen;342
11.1.3.4;8.3.4 Heutiger Stand der Sprecherverifizierung;346
11.1.3.5;8.3.5 Sprecheridentifizierung;346
11.1.4;8.4 Sprachenerkennung;348
11.1.5;Literatur;349
12;Kapitel-9;352
12.1;Sprachausgabe;352
12.1.1;9.1 Einteilungsprinzipien;352
12.1.2;9.2 Sprachwiedergabe;353
12.1.2.1;9.2.1 Prinzipielle Verfahren;353
12.1.2.2;9.2.2 Anwendungsbeispiele für die Sprachwiedergabe;355
12.1.3;9.3 Sprachsynthese;356
12.1.3.1;9.3.1 Übersicht;356
12.1.3.2;9.3.2 Linguistisch-phonetische Transkription;357
12.1.3.3;9.3.3 Phonetisch-akustische Transkription;362
12.1.3.4;9.3.4 Verkettung der Lautelemente (Konkatenation);365
12.1.3.4.1;9.3.4.1 PSOLA-Verfahren;366
12.1.3.4.2;9.3.4.2 Parametrische Konkatenation in Verbindung mit dem LPC-Verfahren;367
12.1.3.4.3;9.3.4.3 Formant-Synthese;368
12.1.3.4.4;9.3.4.4 Korpus-basierte Synthese (Non-uniform unit selection);371
12.1.3.5;9.3.5 Aktuelle Entwicklungen in der Sprachsynthese;371
12.1.4;Literatur;375
13;Kapitel-10;378
13.1;Sprachdialogsysteme;378
13.1.1;10.1 Einleitende Betrachtungen zur Kommunikation;378
13.1.2;10.2 Eigenschaften des Mensch-Mensch-Dialogs;379
13.1.3;10.3 Mensch-Maschine-Dialog;381
13.1.3.1;10.3.1 Vorbemerkung;381
13.1.3.2;10.3.2 Dialogformen;381
13.1.3.3;10.3.3 Dialogphasen;382
13.1.3.4;10.3.4 Beispiel für eine Dialoggestaltung;383
13.1.3.5;10.3.5 Anforderungen an Dialogsysteme;384
13.1.4;10.4 Klassifikation und Funktion von Dialogsystemen;386
13.1.4.1;10.4.1 Klassifikation;386
13.1.4.2;10.4.2 Allgemeines Schema eines sprachbasierten Dialogsystems;387
13.1.4.3;10.4.3 Beispiel für ein Sprachdialogsystem: VERBMOBIL;389
13.1.5;10.5 Multimediale Dialogsysteme;390
13.1.5.1;10.5.1 Begriffsdefinitionen;390
13.1.5.2;10.5.2 Beispiel für ein multimediales Dialogsystem;391
13.1.5.3;10.5.3 Anwendungsbeispiele;393
13.1.6;10.6 Experimentierfeld ‚Wizard of Oz‘;395
13.1.7;Literatur;397
14;Sachverzeichnis;399



Ihre Fragen, Wünsche oder Anmerkungen
Vorname*
Nachname*
Ihre E-Mail-Adresse*
Kundennr.
Ihre Nachricht*
Lediglich mit * gekennzeichnete Felder sind Pflichtfelder.
Wenn Sie die im Kontaktformular eingegebenen Daten durch Klick auf den nachfolgenden Button übersenden, erklären Sie sich damit einverstanden, dass wir Ihr Angaben für die Beantwortung Ihrer Anfrage verwenden. Selbstverständlich werden Ihre Daten vertraulich behandelt und nicht an Dritte weitergegeben. Sie können der Verwendung Ihrer Daten jederzeit widersprechen. Das Datenhandling bei Sack Fachmedien erklären wir Ihnen in unserer Datenschutzerklärung.