Επιστήμη Δεδομένων: Βασικές Αρχές και Εφαρμογές με Python
Data Science from Scratch : First Principles with Python (τίτλος πρωτοτύπου)
Επιστημονική επιμέλεια: Παγουρτζής, Αριστείδης Θ.
Επιμέλεια κειμένου: Βρασσάς, Νικόλαος
Κυκλοφορεί
ISBN: 978-960-491-144-8
Παπασωτηρίου, Αθήνα, 11/2021
2η έκδ.
Γλώσσα: Ελληνική, Νέα
Γλώσσα πρωτοτύπου: Αγγλικά
€ 33.00 (περ. ΦΠΑ 6%)
Βιβλίο, Χαρτόδετο
17 x 24 εκ., 675 γρ., 408 σελ.
Περιγραφή

Για να μάθετε πραγματικά την επιστήμη δεδομένων, δεν πρέπει απλώς να κυριαρχήσετε στα εργαλεία –βιβλιοθήκες επιστήμης δεδομένων, πλαίσια, μονάδες κώδικα και εργαλειοθήκες–, αλλά επίσης να κατανοήσετε τις ιδέες και τις αρχές που διέπουν τη λειτουργία τους.

Αυτή η δεύτερη έκδοση της Επιστήμης Δεδομένων: Βασικές Αρχές και Εφαρμογές με Python, ενημερωμένη για την Python 3.6, σας δείχνει πώς λειτουργούν αυτά τα εργαλεία και οι αλγόριθμοι εφαρμόζοντάς τα από τα πρώτα βήματα.
Αν έχετε κλίση στα μαθηματικά και ικανότητες προγραμματισμού, ο συγγραφέας Joel Grus θα σας βοηθήσει να αισθανθείτε άνετα με τα μαθηματικά και τη στατιστική που βρίσκονται στον πυρήνα της επιστήμης δεδομένων, καθώς και με τις απαραίτητες γνώσεις «χακαρίσματος» που απαιτούνται για να ξεκινήσετε ως επιστήμονες δεδομένων. Με νέο υλικό στη βαθιά μάθηση, στη στατιστική και στην επεξεργασία φυσικής γλώσσας, αυτό το ανανεωμένο βιβλίο σάς δείχνει τον τρόπο να βρείτε τα κρυμμένα διαμάντια μέσα στον σημερινό χαώδη κυκεώνα των δεδομένων.

• Πάρτε ένα ταχύρρυθμο μάθημα στην Python
• Μάθετε τις βασικές αρχές της γραμμικής άλγεβρας, της στατιστικής και των πιθανοτήτων – και πώς και πότε χρησιμοποιούνται στην επιστήμη των δεδομένων
• Συλλέξτε, εξερευνήστε, καθαρίστε, μετασχηματίστε και επεξεργαστείτε τα δεδομένα
• «Καταδυθείτε» στις βασικές αρχές της μηχανικής μάθησης
• Υλοποιήστε μοντέλα όπως k-πλησιέστεροι γείτονες, απλοϊκή ταξινόμηση κατά Bayes, γραμμική και λογιστική παλινδρόμηση, δέντρα αποφάσεων, νευρωνικά δίκτυα και ομαδοποίηση
• Εξερευνήστε τα συστήματα συστάσεων, την επεξεργασία φυσικής γλώσσας, την ανάλυση δικτύων, το MapReduce και τις βάσεις δεδομένων

Βιβλιοκριτικές
«Ο Joel σάς ταξιδεύει από τα στοιχειώδη ερωτήματα της επιστήμης των δεδομένων έως την πλήρη κατανόηση των βασικών αλγόριθμων που κάθε επιστήμονας δεδομένων πρέπει να γνωρίζει».
—Rohit Sivaprasad
Μηχανικός, Facebook
«Συνιστώ το βιβλίο Επιστήμη Δεδομένων: Βασικές Αρχές και Εφαρμογές με Python στους αναλυτές και μηχανικούς που θέλουν να εξελιχθούν κατακτώντας το πεδίο της μηχανικής μάθησης. Είναι το καλύτερο εργαλείο για την κατανόηση των βασικών αρχών αυτού του επιστημονικού κλάδου».
—Tom Marthaler
Μηχανικός Διευθυντής, Amazon
«Είναι δύσκολο να μετατρέπεις τις έννοιες της επιστήμης των δεδομένων σε κώδικα. Το βιβλίο του Joel το καθιστά πολύ ευκολότερο».
—William Cox
Μηχανικός μηχανικής μάθησης, Grubhub
Ο Joel Grus είναι μηχανικός έρευνας στο Ινστιτούτο Τεχνητής Νοημοσύνης Allen. Προηγουμένως εργάστηκε ως μηχανικός λογισμικού στην Google και ως επιστήμονας δεδομένων σε διάφορες startups. Ζει στο Σιάτλ, όπου «παρακολουθεί» τακτικά μαθήματα επιστήμης δεδομένων. Γράφει περιστασιακά στο μπλογκ του joelgrus.com και τουιτάρει ολημερίς στο @joelgrus.

Πρόλογος στη Δεύτερη Έκδοση xiii
Πρόλογος στην Πρώτη Έκδοση xvii
Πρόλογος του Μεταφραστή/Επιμελητή xxi
1 Εισαγωγή 1
Η Άνοδος των Δεδομένων 1
Τι Είναι η Επιστήμη Δεδομένων; 1
Ξεκινώντας την Εκπαίδευση: Το Κοινωνικό Δίκτυο DataSciencester 2
Βρίσκοντας τους Πιο Δικτυωμένους 3
Επιστήμονες Δεδομένων Που Ίσως Γνωρίζετε 6
Αμοιβές και Εμπειρία 9
Συνδρομητικοί Λογαριασμοί 11
Ενδιαφέροντα 12
Στη Συνέχεια 13
2 Ένα Ταχύρρυθμο Μάθημα Python 15
Το Zen της Python 15
Αποκτώντας την Python 15
Εικονικά Περιβάλλοντα 16
Μορφοποίηση Κενών 17
Μονάδες Κώδικα (Module)18
Συναρτήσεις 19
Συμβολοσειρές 20
Εξαιρέσεις 21
Λίστες 21
Πλειάδες 23
Λεξικά 23
defaultdict: Ένα Βολικό Λεξικό 25
Μετρητές 26
Σύνολα 26
Έλεγχος Ροής 27
Αληθοτιμές 28
Ταξινόμηση 29
Συνόψεις Λιστών 29
Αυτόματος Έλεγχος και Βεβαιώσεις 30
Αντικειμενοστρεφής Προγραμματισμός 31
Διατρέξιμες Δομές και Γεννήτριες 33
Τυχαιότητα 34
Κανονικές Εκφράσεις 35
Συναρτησιακός Προγραμματισμός 36
Συνάρτηση zip και Αποσυσκευασία Ορισμάτων 36
args και kwargs 37
Σχολιασμός Τύπων 38
Πώς να Γράφετε Σχόλια Τύπων 40
Καλωσήλθατε στο DataSciencester! 42
Για Περαιτέρω Διερεύνηση 42
3 Οπτικοποίηση Δεδομένων 43
Matplotlib 43
Ραβδογράμματα 45
Γραμμογράμματα 49
Διαγράμματα Διασποράς 50
Για Περαιτέρω Διερεύνηση 52
4 Γραμμική Άλγεβρα 55
Διανύσματα 55
Πίνακες 59
Για Περαιτέρω Διερεύνηση 62
5 Στατιστική 63
Περιγραφή ενός Συνόλου Δεδομένων 63
Κεντρικές Τάσεις 65
Διασπορά 67
Συσχέτιση68
Το Παράδοξο του Simpson 71
Μερικές Ακόμη Προειδοποιήσεις για τη Συσχέτιση 72
Συσχέτιση και Αιτιότητα 73
Για Περαιτέρω Διερεύνηση 74
6 Πιθανότητες 75
Εξάρτηση και Ανεξαρτησία 75
Δεσμευμένη Πιθανότητα 76
Το Θεώρημα του Bayes 78
Τυχαίες Μεταβλητές 79
Συνεχείς Κατανομές80
Η Κανονική Κατανομή 81
Το Κεντρικό Οριακό Θεώρημα 84
Για Περαιτέρω Διερεύνηση 86
7 Υποθέσεις και Συμπερασμός 87
Στατιστικός Έλεγχος Υποθέσεων 87
Παράδειγμα: Ρίψη Νομίσματος 87
p-Τιμές 90
Διαστήματα Εμπιστοσύνης 92
p-Χακάρισμα 93
Παράδειγμα: Εκτέλεση ενός Α/Β Τεστ 94
Συμπερασμός κατά Bayes 95
Για Περαιτέρω Διερεύνηση 99
8 Κάθοδος Κλίσης 101
H Ιδέα Πίσω από την Κάθοδο Κλίσης 101
Εκτίμηση της Κλίσης102
Χρησιμοποιώντας την Κλίση 105
Επιλέγοντας το Σωστό Μέγεθος Βήματος 106
Χρήση της Καθόδου Κλίσης για Προσαρμογή Μοντέλων 106
Δεσμίδες Δειγμάτων και Στοχαστική Κάθοδος Κλίσης 108
Για Περαιτέρω Διερεύνηση 110
9 Αποκτώντας Δεδομένα 111
stdin και stdout 111
Ανάγνωση Αρχείων 113
Τα Βασικά των Αρχείων Κειμένου 113
Αρχεία με Διαχωριστικά 115
«Σκαλίζοντας» το Διαδίκτυο 116
Η HTML και η Ανάλυσή της 117
Παράδειγμα: Παρακολουθώντας το Κογκρέσο 119
Χρησιμοποιώντας APIs 121
JSON και XML 121
Χρησιμοποιώντας μη Πιστοποιημένο API 122
Βρίσκοντας APIs 124
Παράδειγμα: Χρησιμοποιώντας τα APIs του Twitter 124
Αποκτώντας Διαπιστευτήρια 124
Χρησιμοποιώντας το Twython 125
Για Περαιτέρω Διερεύνηση 128
ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ | vii
Book Data Scienceindb vii 19/10/2021 2:05:49 μμ
10 Εργασία με Δεδομένα 129
Εξερευνώντας τα Δεδομένα σας 129
Εξερευνώντας Μονοδιάστατα Δεδομένα 129
Δύο Διαστάσεις 131
Πολλές Διαστάσεις 133
Χρησιμοποιώντας NamedTuples 135
Dataclasses 137
Καθαρισμός και Προσαρμογή 138
Χειρισμός Δεδομένων 140
Αναπροσαρμογή Κλίμακας 143
Παρενθετικά: tqdm 145
Μείωση Διαστάσεων 146
Για Περαιτέρω Διερεύνηση 151
11 Μηχανική Μάθηση 153
Μοντελοποίηση 153
Τι Είναι η Μηχανική Μάθηση; 154
Υπερπροσαρμογή και Υποπροσαρμογή 155
Ορθότητα 157
Ο Συμβιβασμός Μεροληψίας-Διακύμανσης 160
Εξαγωγή και Επιλογή Χαρακτηριστικών 161
Για Περαιτέρω Διερεύνηση 163
12 k-Πλησιέστεροι Γείτονες 165
Το Μοντέλο 165
Παράδειγμα: Το Σύνολο Δεδομένων Iris 167
Η «Κατάρα» της Διαστατικότητας 170
Για Περαιτέρω Διερεύνηση 174
13 Απλοϊκή Ταξινόμηση κατά Bayes 175
Ένα Απλοϊκό Φίλτρο Spam 175
Ένα Πιο Εξελιγμένο Φίλτρο Spam 176
Εφαρμογή 177
Ελέγχοντας το Μοντέλο Μας 180
Χρησιμοποιώντας το Μοντέλο Μας 181
Για Περαιτέρω Διερεύνηση 183
14 Απλή Γραμμική Παλινδρόμηση 185
Το Μοντέλο 185
Χρησιμοποιώντας Κάθοδο Κλίσης 189
viii | Επιστήμη Δεδομένων – Βασικές Αρχές και Εφαρμογές με Python
Book Data Scienceindb viii 19/10/2021 2:05:49 μμ
Εκτίμηση Μέγιστης Πιθανοφάνειας 190
Για Περαιτέρω Διερεύνηση 190
15 Πολλαπλή Παλινδρόμηση 191
Το Μοντέλο 191
Επιπλέον Υποθέσεις για το Μοντέλο Ελαχίστων Τετραγώνων 192
Προσαρμογή του Μοντέλου 193
Ερμηνεία του Μοντέλου 195
Ποιότητα Προσαρμογής 196
Παρέκβαση: Χτίσιμο εκ των Ενόντων (Bootstrap) 196
Τυπικά Σφάλματα Συντελεστών Παλινδρόμησης 198
Κανονικοποίηση 200
Για Περαιτέρω Διερεύνηση 202
16 Λογιστική Παλινδρόμηση 203
Το Πρόβλημα 203
Η Λογιστική Συνάρτηση 206
Εφαρμογή του Μοντέλου 208
Ποιότητα Προσαρμογής 209
Μηχανές Διανυσμάτων Υποστήριξης 211
Για Περαιτέρω Διερεύνηση 214
17 Δέντρα Αποφάσεων 215
Τι Είναι ένα Δέντρο Απόφασης; 215
Εντροπία 217
Η Εντροπία μιας Διαμέρισης 219
Δημιουργία ενός Δέντρου Απόφασης 220
Συνδυάζοντάς τα Όλα 222
Τυχαία Δάση 225
Για Περαιτέρω Διερεύνηση 226
18 Νευρωνικά Δίκτυα 227
Perceptron: Ένα Απλό Μοντέλο Νευρώνα 227
Νευρωνικά Δίκτυα Πρόσθιας Τροφοδότησης 230
Οπισθοδιάδοση (Backpropagation) 233
Παράδειγμα: Fizz Buzz 235
Για Περαιτέρω Διερεύνηση 238
19 Βαθιά Μάθηση 239
Ο Τανυστής 239
Η Αφαιρετική Έννοια των Επιπέδων 242
ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ | ix
Book Data Scienceindb ix 19/10/2021 2:05:49 μμ
Το Γραμμικό Επίπεδο 244
Νευρωνικά Δίκτυα ως Ακολουθία Επιπέδων 246
Απώλεια και Βελτιστοποίηση 247
Παράδειγμα: Μια Νέα Εκδοχή της XOR 250
Άλλες Συναρτήσεις Ενεργοποίησης 251
Παράδειγμα: Μια Νέα Εκδοχή της FizzBuzz 252
Συναρτήσεις Softmax και Cross-Entropy 253
Απόσυρση (Dropout) 256
Παράδειγμα: MNIST 257
Αποθήκευση και Φόρτωση Μοντέλων 261
Για Περαιτέρω Διερεύνηση 262
20 Ομαδοποίηση 263
Η Ιδέα 263
Το Μοντέλο 264
Παράδειγμα: Συναντήσεις 266
Επιλέγοντας το k 268
Παράδειγμα: Ομαδοποίηση Χρωμάτων 269
Ιεραρχική Ομαδοποίηση από Κάτω προς τα Επάνω (Bottom-Up) 271
Για Περαιτέρω Διερεύνηση 277
21 Επεξεργασία Φυσικής Γλώσσας 279
Νέφη Λέξεων 279
Γλωσσικά Μοντέλα (n-Gram) 281
Γραμματικές 284
Μια Παρένθεση: Δειγματοληψία Gibbs 286
Μοντελοποίηση Θεμάτων 288
Διανύσματα Λέξεων 293
Αναδρομικά Νευρωνικά Δίκτυα (RNN) 302
Παράδειγμα: Χρήση ενός RNN Επιπέδου Χαρακτήρα 305
Για Περαιτέρω Διερεύνηση 308
22 Ανάλυση Δικτύων 309
Κεντρικότητα Ενδιαμεσότητας (Betweenness) 309
Κεντρικότητα Ιδιοδιανύσματος 314
Πολλαπλασιασμός Πινάκων 314
Κεντρικότητα 316
Κατευθυνόμενοι Γράφοι και PageRank 318
Για Περαιτέρω Διερεύνηση 320
x | Επιστήμη Δεδομένων – Βασικές Αρχές και Εφαρμογές με Python
Book Data Scienceindb x 19/10/2021 2:05:49 μμ
23 Συστήματα Συστάσεων 321
Προσωπική Επιμέλεια 322
Προτείνοντας τα Δημοφιλή 322
Συνεργατικό Φιλτράρισμα Βασισμένο στον Χρήστη 323
Συνεργατικό Φιλτράρισμα Βασισμένο στα Προϊόντα 326
Παραγοντοποίηση Πινάκων328
Για Περαιτέρω Διερεύνηση 333
24 Βάσεις Δεδομένων και SQL 335
Δημιουργία Πίνακα (CREATE TABLE) και Εισαγωγή (INSERT) 335
Ενημέρωση (UPDATE) 338
Διαγραφή (DELETE) 339
Επιλογή (SELECT) 340
Ομαδοποίηση Κατά (GROUP BY) 342
Ταξινόμηση Κατά (ORDER BY) 345
Συνένωση (JOIN) 345
Υποερωτήματα 348
Ευρετήρια 349
Βελτιστοποίηση Ερωτημάτων 349
NoSQL 350
Για Περαιτέρω Διερεύνηση 350
25 MapReduce 351
Παράδειγμα: Καταμέτρηση Λέξεων 352
Γιατί MapReduce; 353
Το MapReduce Γενικότερα 354
Παράδειγμα: Ανάλυση Ενημερώσεων Κατάστασης 355
Παράδειγμα: Πολλαπλασιασμός Πινάκων 357
Μια Παρένθεση: Συνδυαστές (Combiners) 359
Για Περαιτέρω Διερεύνηση 359
26 Ηθική των Δεδομένων 361
Τι Είναι η Ηθική των Δεδομένων; 361
Τι Είναι Στ’ Αλήθεια η Ηθική των Δεδομένων; 362
Πρέπει να Μας Ενδιαφέρει η Ηθική των Δεδομένων; 362
Κατασκευή Κακών Προϊόντων Δεδομένων 363
Συμβιβασμός Μεταξύ Ακρίβειας και Αμεροληψίας 363
Συνεργασία 365
Ερμηνευσιμότητα 366
Συστάσεις 366
Δεδομένα με Μεροληψία 367
Προστασία Δεδομένων 368
Περιληπτικά 369
Για Περαιτέρω Διερεύνηση 369
27 Ξεκινήστε να Χρησιμοποιείτε την Επιστήμη Δεδομένων στην Πράξη 371
IPython 371
Μαθηματικά 371
Όχι από το Mηδέν 372
NumPy 372
pandas 372
scikit-learn 372
Οπτικοποίηση 373
R 373
Βαθιά Μάθηση 374
Βρείτε Δεδομένα 374
Επιστήμη Δεδομένων στην Πράξη 374
Hacker News 375
Πυροσβεστικά Οχήματα 375
Μπλουζάκια 375
Tweet Επάνω στην Υδρόγειο 376
Και Εσείς; 376
Ευρετήριο 377


Add: 2022-01-12 13:50:18 - Upd: 2022-05-03 18:27:00