E-Book, Englisch, 182 Seiten
Lai / Potaczek Hands-On Big Data Analytics with PySpark
1. Auflage 2019
ISBN: 978-1-83864-883-1
Verlag: De Gruyter
Format: EPUB
Kopierschutz: Adobe DRM (»Systemvoraussetzungen)
Analyze large datasets and discover techniques for testing, immunizing, and parallelizing Spark jobs
E-Book, Englisch, 182 Seiten
ISBN: 978-1-83864-883-1
Verlag: De Gruyter
Format: EPUB
Kopierschutz: Adobe DRM (»Systemvoraussetzungen)
No detailed description available for "Hands-On Big Data Analytics with PySpark".
Autoren/Hrsg.
Fachgebiete
- Mathematik | Informatik EDV | Informatik Daten / Datenbanken Datenbankdesign & Datenbanktheorie
- Mathematik | Informatik EDV | Informatik Informatik Mensch-Maschine-Interaktion Informationsarchitektur
- Mathematik | Informatik EDV | Informatik Daten / Datenbanken Automatische Datenerfassung, Datenanalyse
- Mathematik | Informatik EDV | Informatik Informatik Künstliche Intelligenz
Weitere Infos & Material
Table of Contents - Installing Pyspark and Setting up Your Development Environment
- Getting Your Big Data into the Spark Environment Using RDDs
- Big Data Cleaning and Wrangling with Spark Notebooks
- Aggregating and Summarizing Data into Useful Reports
- Powerful Exploratory Data Analysis with MLlib
- Putting Structure on Your Big Data with SparkSQL
- Transformations and Actions
- Immutable Design
- Avoiding Shuffle and Reducing Operational Expenses
- Saving Data in the Correct Format
- Working with the Spark Key/Value API
- Testing Apache Spark Jobs
- Leveraging the Spark GraphX API