Buch, Englisch, 672 Seiten, Format (B × H): 170 mm x 244 mm, Gewicht: 1252 g
Buch, Englisch, 672 Seiten, Format (B × H): 170 mm x 244 mm, Gewicht: 1252 g
ISBN: 978-1-119-56107-1
Verlag: Wiley
Ein unverzichtbarer Leitfaden bei der Anwendung computergestützter Statistik in der modernen Datenwissenschaft
In Computational Statistics in Data Science präsentiert ein Team aus bekannten Mathematikern und Statistikern eine fundierte Zusammenstellung von Konzepten, Theorien, Techniken und Praktiken der computergestützten Statistik für ein Publikum, das auf der Suche nach einem einzigen, umfassenden Referenzwerk für Statistik in der modernen Datenwissenschaft ist. Das Buch enthält etliche Kapitel zu den wesentlichen konkreten Bereichen der computergestützten Statistik, in denen modernste Techniken zeitgemäß und verständlich dargestellt werden.
Darüber hinaus bietet Computational Statistics in Data Science einen kostenlosen Zugang zu den fertigen Einträgen im Online-Nachschlagewerk Wiley StatsRef: Statistics Reference Online. Außerdem erhalten die Leserinnen und Leser:
* Eine gründliche Einführung in die computergestützte Statistik mit relevanten und verständlichen Informationen für Anwender und Forscher in verschiedenen datenintensiven Bereichen
* Umfassende Erläuterungen zu aktuellen Themen in der Statistik, darunter Big Data, Datenstromverarbeitung, quantitative Visualisierung und Deep Learning
Das Werk eignet sich perfekt für Forscher und Wissenschaftler sämtlicher Fachbereiche, die Techniken der computergestützten Statistik auf einem gehobenen oder fortgeschrittenen Niveau anwenden müssen. Zudem gehört Computational Statistics in Data Science in das Bücherregal von Wissenschaftlern, die sich mit der Erforschung und Entwicklung von Techniken der computergestützten Statistik und statistischen Grafiken beschäftigen.
Autoren/Hrsg.
Fachgebiete
Weitere Infos & Material
List of Contributors xxiii
Preface xxix
Part I Computational Statistics and Data Science 1
1 Computational Statistics and Data Science in the Twenty-first Century 3
Andrew J. Holbrook, Akihiko Nishimura, Xiang Ji, and Marc A. Suchard
1 Introduction 3
2 Core Challenges 1–3 5
3 Model-Specific Advances 8
4 Core Challenges 4 and 5 12
5 Rise of Data Science 16
2 Statistical Software 23
Alfred G. Schissler and Alexander D. Knudson
1 User Development Environments 23
2 Popular Statistical Software 26
3 Noteworthy Statistical Software and Related Tools 30
4 Promising and Emerging Statistical Software 36
5 The Future of Statistical Computing 38
6 Concluding Remarks 39
3 An Introduction to Deep Learning Methods 43
Yao Li, Justin Wang and Thomas C.M. Lee
1 Introduction 43
2 Machine Learning: An Overview 43
3 Feedforward Neural Networks 45
4 Convolutional Neural Networks 48
5 Autoencoders 52
6 Recurrent Neural Networks 54
7 Conclusion 57
4 Streaming Data and Data Streams 59
Taiwo Kolajo, Olawande Daramola, and Ayodele Adebiyi
1 Introduction 59
2 Data Stream Computing 61
3 Issues in Data Stream Mining 61
4 Streaming Data Tools and Technologies 64
5 Streaming Data Pre-Processing: Concept and Implementation 65
6 Streaming Data Algorithms 65
7 Strategies for Processing Data Streams 68
8 Best Practices for Managing Data Streams 69
9 Conclusion and theWay Forward 70
Part II Simulation-Based Methods 79
5 Monte Carlo Simulation: Are We There Yet? 81
Dootika Vats, James M. Flegal, and Galin L. Jones
1 Introduction 81
2 Estimation 83
3 Sampling Distribution 84
4 Estimating S 87
5 Stopping Rules 88
6 Workflow 89
7 Examples 90
6 Sequential Monte Carlo: Particle Filters and Beyond 99
Adam M. Johansen
1 Introduction 99
2 Sequential Importance Sampling and Resampling 99
3 SMC in Statistical Contexts 106
4 Selected Recent Developments 112
7 Markov Chain Monte Carlo Methods, A Survey with Some Frequent Misunderstandings 119
Christian P. Robert and Wu Changye
1 Introduction 119
2 Monte Carlo Methods 121
3 Markov Chain Monte Carlo Methods 128
4 Approximate Bayesian Computation 141
5 Further Reading 145
8 Bayesian Inference with Adaptive Markov Chain Monte Carlo 151
Matti Vihola
1 Introduction 151
2 Random-Walk Metropolis Algorithm 151
3 Adaptation of Random-Walk Metropolis 152
4 Multimodal Targets with Parallel Tempering 156
5 Dynamic Models with Particle Filters 157
6 Discussion 159
9 Advances in Importance Sampling 165
Víctor Elvira and Luca Martino
1 Introduction and Problem Statement 165
2 Importance Sampling 167
3 Multiple Importance Sampling (MIS) 171
4 Adaptive Importance Sampling (AIS) 174
Part III Statistical Learning 183
10 Supervised Learning 185
Weibin Mo and Yufeng Liu
1 Introduction 185
2 Penalized Empirical Risk Minimization 186
3 Linear Regression 190
4 Classification 193
5 Extensions for Complex Data 200
6 Discussion 203
11 Unsupervised and Semisupervised Learning 209
Jia Li and Vincent A. Pisztora
1 Introduction 209
2 Unsupervised Learning 210
3 Semisupervised Learning 219
4 Conclusions 224
12 Random Forest 231
Peter Calhoun, Xiaogang Su, Kelly M. Spoon, Richard A. Levine, and Juanjuan Fan
1 Introduction 231
2 Random Forest (RF) 232
3 Random Forest Extensions 235
4 Random Forests of Interaction Trees (RFIT) 239
5 Random Forest of Interaction Trees for Observational Studies 243
6 Discussion 249
13 Network Analysis 253
Rong Ma and Hongzhe Li
1 Introduction 253
2 Gaussian Graphical Models for Mixed Partial Compositional Data 255
3 Theoretical Properties 257
4 Graphical Model Selection 260
5 Analysis of a Microbiome–Metabolomics Data 260
6 Discussion 261
14 Tensors in Modern Statistical Learning 269
Will Wei Sun, Botao Hao, and Lexin Li
1 Introduction 269
2 Background270
3 Tensor Supervised Learning 272
4 Tensor Unsupervised Learning 276
5 Tensor Reinforcement Learning 282
6 Tensor Deep Learning 286
15 Computational Approaches to Bayesian Additive Regression Trees 297
Hugh Chipman, Edward George, Richard Hahn, Robert McCulloch, Matthew Pratola, and Rodney Sparapani
1 Introduction 297
2 Bayesian CART 298
3 TreeMCMC302
4 The BART Model 308
5 BART Example: Boston Housing Values and Air Pollution 310
6 BARTMCMC311
7 BART Extentions 313
8 Conclusion 320
Part IV High-Dimensional Data Analysis 323
16 Penalized Regression 325
Seung Jun Shin and Yichao Wu
1 Introduction 325
2 Penalization for Smoothness 326
3 Penalization for Sparsity 328
4 Tuning Parameter Selection 330
17 Model Selection in High-Dimensional Regression 333
Hao H. Zhang
1 Model Selection Problem 333
2 Model Selection in High-Dimensional Linear Regression 335
3 Interaction-Effect Selection for High-Dimensional Data 339
4 Model Selection in High-Dimensional Nonparametric Models 342
5 Concluding Remarks 349
18 Sampling Local Scale Parameters in High-Dimensional Regression Models 355
Anir




