Sauer | Moderne Datenanalyse mit R | E-Book | www.sack.de
E-Book

E-Book, Deutsch, 559 Seiten

Reihe: FOM-Edition

Sauer Moderne Datenanalyse mit R

Daten einlesen, aufbereiten, visualisieren, modellieren und kommunizieren
1. Auflage 2019
ISBN: 978-3-658-21587-3
Verlag: Springer
Format: PDF
Kopierschutz: 1 - PDF Watermark

Daten einlesen, aufbereiten, visualisieren, modellieren und kommunizieren

E-Book, Deutsch, 559 Seiten

Reihe: FOM-Edition

ISBN: 978-3-658-21587-3
Verlag: Springer
Format: PDF
Kopierschutz: 1 - PDF Watermark



Die Kaufempfehlung, die Ihnen ein Webstore ausspricht, die Einschätzung, welcher Kunde kreditwürdig ist, oder die Analyse der Werttreiber von Immobilien - alle diese Beispiele aus dem heutigen Leben sind Ergebnis moderner Verfahren der Datenanalyse. Dieses Buch führt in solche statistische Verfahren anhand der Programmiersprache R ein. 
Ziel ist es, Leser mit der Art und Weise vertraut zu machen, wie führende Organisationen und Praktiker angewandte Statistik heute einsetzen. Weil sich mit der Digitalisierung auch die statistischen Verfahren verändert haben, vermittelt der Autor neben klassischen Analysemethoden wie Regression auch moderne Methoden wie Textmining und Random-Forest-Modelle. Dabei sind die Inhalte des Buchs durchgehend so aufbereitet, dass sie auch für Leser ohne umfangreiche mathematische Vorkenntnisse verständlich sind. Anhand von Fallbeispielen und Übungen werden die Leser durch alle Phasen der Datenanalyse geführt: Sie lernen, wie Daten eingelesen, aufbereitet, visualisiert, modelliert und kommuniziert werden können. Dabei wird vor allem die Aufbereitung, Umformung und Prüfung der Daten ausführlicher als in anderen Publikationen behandelt, da dieser Teil in der Praxis oft einen wesentlichen Teil des Aufwands ausmacht. Aber auch die Visualisierung bekommt viel Raum, denn gute Diagramme ermöglichen Einblicke, die Zahlen und Worte verbergen.Mit seinem praxisorientierten Ansatz will das Buch dazu befähigen,alle grundlegenden Schritte eines Datenanalyseprojekts durchzuführen,
Daten kompetent in R zu bearbeiten,
simulationsbasierte Inferenzstatistik anzuwenden und kritisch zu hinterfragen,
klassische und moderne Vorhersagemethoden anzuwenden und
betriebswirtschaftliche Fragestellungen mittels datengetriebener Vorhersagemodelle zu beantworten.
Sowohl Anwender ohne statistisches Grundlagenwissen als auch Nutzer mit Vorerfahrung lesen dieses Buch mit Gewinn. In verständlicher Sprache und anhand von anschaulichen Beispielen zeigt der Autor, wie moderne Datenanalyse heute funktioniert. 

Professor Dr. habil. Sebastian Sauer arbeitet als Hochschullehrer für Wirtschaftspsychologie an der FOM Hochschule für Oekonomie & Management in Nürnberg und versteht sich als Data Scientist. Daten mit R zu analysieren, ist aktuell eines seiner zentralen Interessensgebiete. Besonderes Augenmerk legt er auf den Erkenntnisbeitrag, den neue Analyseverfahren leisten. Neben dem 'Wie' der Datenanalyse beschäftigen ihn die Grenzen und Gefahren, die die moderne Datenwissenschaft für den Einzelnen und die Zivilgesellschaft mit sich bringt. Außerdem engagiert er sich für das Thema Open Science und interessiert sich für die Frage, wie die Psychologie zur Klärung von Problemen mit gesellschaftlicher Relevanz beitragen kann. Sein Blog https://data-se.netlify.com/ dient ihm als Notizbuch sich entwickelnder Gedanken. Data Science für die Wirtschaft bietet er auf https://www.data-divers.com/ an.

Sauer Moderne Datenanalyse mit R jetzt bestellen!

Autoren/Hrsg.


Weitere Infos & Material


1;Vorwort;6
2;Inhaltsverzeichnis;12
3;Der Autor;12
4;Teil I Rahmen;23
4.1;1 Statistik heute;24
4.1.1;1.1 Datenanalyse, Statistik, Data Science und Co.;25
4.1.2;1.2 Wissensgebiete der Datenanalyse;27
4.1.3;1.3 Einige Grundbegriffe;29
4.1.4;1.4 Signal und Rauschen;30
4.2;2 Hallo, R;33
4.2.1;2.1 Eine kurze Geschichte von R;33
4.2.2;2.2 Warum R? Warum, R?;35
4.3;3 R starten;40
4.3.1;3.1 R und RStudio installieren;40
4.3.2;3.2 Pakete;42
4.3.3;3.3 Hilfe! R startet nicht!;44
4.3.4;3.4 Zuordnung von Paketen zu Befehlen;46
4.3.5;3.5 R-Skript-Dateien;48
4.3.6;3.6 Daten;48
4.3.7;3.7 Grundlagen der Arbeit mit RStudio;49
4.3.8;3.8 Hier werden Sie geholfen;52
4.4;4 Erstkontakt;55
4.4.1;4.1 R ist pingelig;55
4.4.2;4.2 Variablen zuweisen und auslesen;56
4.4.3;4.3 Funktionen aufrufen;57
4.4.4;4.4 Logische Prüfungen;58
4.4.5;4.5 Vektorielle Funktionen;60
4.4.6;4.6 Literaturempfehlungen;61
5;Teil II Daten einlesen;62
5.1;5 Datenstrukturen;63
5.1.1;5.1 Überblick über die wichtigsten Objekttypen;63
5.1.2;5.2 Objekttypen in R;65
5.1.3;5.3 Daten auslesen und indizieren;71
5.1.4;5.4 Namen geben;76
5.2;6 Datenimport und -export;79
5.2.1;6.1 Daten in R importieren;79
5.2.2;6.2 Textkodierung;84
5.2.3;6.3 Daten exportieren;85
6;Teil III Daten aufbereiten;88
6.1;7 Datenjudo;89
6.1.1;7.1 Daten aufbereiten mit dplyr;91
6.1.2;7.2 Zentrale Bausteine von dplyr;92
6.1.3;7.3 Die Pfeife;105
6.1.4;7.4 Spalten berechnen mit mutate();107
6.1.5;7.5 Bedingte Analysen mit den Suffixen von dplyr;110
6.1.6;7.6 Tabellen zusammenführen (join);113
6.2;8 Deskriptive Statistik;116
6.2.1;8.1 Univariate Statistik;117
6.2.2;8.2 Korrelationen berechnen;125
6.3;9 Praxisprobleme der Datenaufbereitung;130
6.3.1;9.1 Fehlende Werte;131
6.3.2;9.2 Datenanomalien;138
6.3.3;9.3 Daten umformen;143
6.3.4;9.4 Werte umkodieren und partitionieren;149
6.3.5;9.5 Vektoren zu Skalaren zusammenfassen;154
6.4;10 Fallstudie: Datenjudo;157
6.4.1;10.1 Deskriptive Statistiken zu den New Yorker Flügen;158
6.4.2;10.2 Visualisierungen zu den deskriptiven Statistiken;161
7;Teil IV Daten visualisieren;166
7.1;11 Datenvisualisierung mit ggplot2;167
7.1.1;11.1 Einstieg in ggplot2;168
7.1.2;11.2 Häufige Arten von Diagrammen (Geomen);176
7.1.3;11.3 Die Gefühlswelt von ggplot2;188
7.1.4;11.4 ggplot(), der große Bruder von qplot();189
7.2;12 Fortgeschrittene Themen der Visualisierung;197
7.2.1;12.1 Farbwahl;197
7.2.2;12.2 ggplot2-Themen;204
7.2.3;12.3 Interaktive Diagramme;207
7.3;13 Fallstudie: Visualisierung;210
7.3.1;13.1 Umfragedaten visualisieren mit „likert“;211
7.3.2;13.2 Umfragedaten visualisieren mit ggplot;212
7.4;14 Geovisualisierung;224
7.4.1;14.1 Kartendaten;225
7.4.2;14.2 Unterschiede in Kartensegmenten visualisieren;228
7.4.3;14.3 Weltkarten;233
7.4.4;14.4 Anwendungsbeispiel: Konkordanz von Kulturwerten und Wohlbefinden;238
7.4.5;14.5 Interaktive Karten;243
8;Teil V Modellieren;251
8.1;15 Grundlagen des Modellierens;252
8.1.1;15.1 Was ist ein Modell? Was ist Modellieren?;253
8.1.2;15.2 Abduktion als Erkenntnisfigur im Modellieren;255
8.1.3;15.3 Ein Beispiel zum Modellieren in der Datenanalyse;257
8.1.4;15.4 Taxonomie der Ziele des Modellierens;258
8.1.5;15.5 Die vier Schritte des statistischen Modellierens;261
8.1.6;15.6 Einfache vs. komplexe Modelle: Unter- vs. Überanpassung;262
8.1.7;15.7 Bias-Varianz-Abwägung;263
8.1.8;15.8 Trainings- vs. Test-Stichprobe;264
8.1.9;15.9 Resampling und Kreuzvalidierung;266
8.1.10;15.10 Wann welches Modell?;267
8.1.11;15.11 Modellgüte;267
8.1.12;15.12 Der Fluch der Dimension;269
8.2;16 Inferenzstatistik;274
8.2.1;16.1 Wozu Inferenzstatistik?;275
8.2.2;16.2 Der p-Wert;276
8.2.3;16.3 Wann welcher Inferenztest?;284
8.2.4;16.4 Beispiele für häufige Inferenztests;285
8.2.5;16.5 Alternativen zum p-Wert;293
8.3;17 Simulationsbasierte Inferenz;308
8.3.1;17.1 Stichproben, Statistiken und Population;308
8.3.2;17.2 Die Stichprobenverteilung;311
8.3.3;17.3 Der Bootstrap;315
8.3.4;17.4 Nullhypothesen auf Signifikanz testen;318
9;Teil VI Geleitetes Modellieren;325
9.1;18 Lineare Modelle;326
9.1.1;18.1 Die Idee der klassischen Regression;326
9.1.2;18.2 Modellgüte;329
9.1.3;18.3 Die Regression an einem Beispiel erläutert;332
9.1.4;18.4 Überprüfung der Annahmen der linearen Regression;334
9.1.5;18.5 Regression mit kategorialen Prädiktoren;336
9.1.6;18.6 Multiple Regression;338
9.1.7;18.7 Interaktionen;340
9.1.8;18.8 Prädiktorenrelevanz;342
9.1.9;18.9 Anwendungsbeispiel zur linearen Regression;344
9.2;19 Klassifizierende Regression;350
9.2.1;19.1 Normale Regression für ein binäres Kriterium;351
9.2.2;19.2 Die logistische Funktion;352
9.2.3;19.3 Interpretation des Logits;355
9.2.4;19.4 Kategoriale Prädiktoren;356
9.2.5;19.5 Multiple logistische Regression;357
9.2.6;19.6 Modellgüte;358
9.2.7;19.7 Vorhersagen;361
9.2.8;19.8 ROC-Kurven und Fläche unter der Kurve (AUC);362
9.3;20 Fallstudie: Titanic;369
9.3.1;20.1 Explorative Analyse;370
9.3.2;20.2 Inferenzstatistik;372
9.4;21 Baumbasierte Verfahren;381
9.4.1;21.1 Entscheidungsbäume;382
9.4.2;21.2 Entscheidungsbäume mit caret;388
9.4.3;21.3 Der Algorithmus der Entscheidungsbäume;395
9.4.4;21.4 Regressionsbäume;395
9.4.5;21.5 Stärken und Schwächen von Bäumen;395
9.4.6;21.6 Bagging;397
9.4.7;21.7 Grundlagen von Random Forests;398
9.4.8;21.8 Variablenrelevanz bei Baummodellen;402
9.5;22 Fallstudie: Kreditwürdigkeit mit caret;405
9.5.1;22.1 Zwei Arten der prädiktiven Modellierung;406
9.5.2;22.2 Daten aufbereiten;407
9.5.3;22.3 Modelle anpassen;411
9.5.4;22.4 Modellgüte bestimmen;422
9.5.5;22.5 Wichtigkeit der Prädiktoren bestimmen;430
10;Teil VII Ungeleitetes Modellieren;438
10.1;23 Clusteranalyse;439
10.1.1;23.1 Grundlagen der Clusteranalyse;439
10.1.2;23.2 Beispiel für eine einfache Clusteranalyse;445
10.2;24 Textmining;451
10.2.1;24.1 Grundlegende Analyse;452
10.2.2;24.2 Sentimentanalyse;461
10.3;25 Fallstudie: Twitter-Mining;465
10.3.1;25.1 Zum Einstieg: Moderne Methoden der Sentimentanalyse;466
10.3.2;25.2 Grundlagen des Twitter-Minings;467
11;Teil VIII Kommunizieren;475
11.1;26 RMarkdown;476
11.1.1;26.1 Forderungen an Werkzeuge zur Berichterstellung;477
11.1.2;26.2 Start mit RMarkdown;479
11.1.3;26.3 RMarkdown in Action;481
11.1.4;26.4 Aufbau einer Markdown-Datei;483
11.1.5;26.5 Syntax-Grundlagen von Markdown;484
11.1.6;26.6 Tabellen;485
11.1.7;26.7 Zitieren;488
11.1.8;26.8 Format-Vorlagen für RMarkdown;490
12;Teil IX Rahmen 2;493
12.1;27 Projektmanagement am Beispiel einer Fallstudie;494
12.1.1;27.1 Was ist Populismus?;495
12.1.2;27.2 Forschungsfrage und Operationalisierung;496
12.1.3;27.3 Emotionslexikon;497
12.1.4;27.4 Daten, Stichprobe und Analysekontext;498
12.1.5;27.5 Prozess der Datenanalyse;498
12.1.6;27.6 Zentrale Ergebnisse;500
12.1.7;27.7 Projektmanagement;503
12.2;28 Programmieren mit R;510
12.2.1;28.1 Funktionen schreiben;510
12.2.2;28.2 Wiederholungen;513
12.2.3;28.3 Defensives Programmieren;522
12.3;29 Programmieren mit dplyr;525
12.3.1;29.1 Wie man mit dplyr nicht sprechen darf;525
12.3.2;29.2 Standard-Evaluation vs. Non-Standard-Evaluation;526
12.3.3;29.3 NSE als Backen;528
12.3.4;29.4 Wie man Funktionen mit dplyr-Verben schreibt;532
12.3.5;29.5 Beispiele für NSE-Funktionen;535
12.4;Anhang A;539
12.5;Literatur;545
12.6;Sachverzeichnis;556



Ihre Fragen, Wünsche oder Anmerkungen
Vorname*
Nachname*
Ihre E-Mail-Adresse*
Kundennr.
Ihre Nachricht*
Lediglich mit * gekennzeichnete Felder sind Pflichtfelder.
Wenn Sie die im Kontaktformular eingegebenen Daten durch Klick auf den nachfolgenden Button übersenden, erklären Sie sich damit einverstanden, dass wir Ihr Angaben für die Beantwortung Ihrer Anfrage verwenden. Selbstverständlich werden Ihre Daten vertraulich behandelt und nicht an Dritte weitergegeben. Sie können der Verwendung Ihrer Daten jederzeit widersprechen. Das Datenhandling bei Sack Fachmedien erklären wir Ihnen in unserer Datenschutzerklärung.