Σε κάθε κεφάλαιο, ο συγγραφέας Mahmoud Parsian δείχνει πώς να λύνετε ένα πρόβλημα δεδομένων με ένα σύνολο μετασχηματισμών και αλγορίθμων του Spark. Θα μάθετε να αντιμετωπίζετε προβλήματα που σχετίζονται με ETL, σχεδιαστικά πρότυπα, αλγόριθμους μηχανικής μάθησης, κατάτμηση δεδομένων και ανάλυση γονιδιωματικής. Κάθε λεπτομερές παράδειγμα εφαρμογής περιλαμβάνει αλγορίθμους PySpark χρησιμοποιώντας τον driver του PySpark σε κατάλληλο διαδραστικό περιβάλλον.