Μάθετε Μηχανική Χαρακτηριστικών για Επιστήμη Δεδομένων και ML σε 5 λεπτά

Είστε έτοιμοι να μάθετε μηχανική χαρακτηριστικών για μηχανική μάθηση και επιστήμη δεδομένων; Είστε στο σωστό μέρος!

Η μηχανική χαρακτηριστικών είναι μια κρίσιμη δεξιότητα για την εξαγωγή πολύτιμων πληροφοριών από δεδομένα και σε αυτόν τον γρήγορο οδηγό, θα την αναλύσω σε απλά, εύπεπτα κομμάτια. Λοιπόν, ας βουτήξουμε κατευθείαν και ας ξεκινήσουμε το ταξίδι σας για την εξοικείωση με την εξαγωγή χαρακτηριστικών!

Πίνακας περιεχομένων

Τι είναι η Μηχανική Χαρακτηριστικών;

Όταν δημιουργείτε ένα μοντέλο μηχανικής εκμάθησης που σχετίζεται με ένα επιχειρηματικό ή πειραματικό πρόβλημα, παρέχετε δεδομένα εκμάθησης σε στήλες και σειρές. Στον τομέα της επιστήμης δεδομένων και της ανάπτυξης ML, οι στήλες είναι γνωστές ως ιδιότητες ή μεταβλητές.

Τα αναλυτικά δεδομένα ή οι σειρές κάτω από αυτές τις στήλες είναι γνωστές ως παρατηρήσεις ή στιγμιότυπα. Οι στήλες ή τα χαρακτηριστικά είναι τα χαρακτηριστικά σε ένα μη επεξεργασμένο σύνολο δεδομένων.

Αυτά τα πρωτογενή χαρακτηριστικά δεν είναι αρκετά ή βέλτιστα για την εκπαίδευση ενός μοντέλου ML. Για να μειώσετε το θόρυβο των συλλεγόμενων μεταδεδομένων και να μεγιστοποιήσετε τα μοναδικά σήματα από χαρακτηριστικά, πρέπει να μετατρέψετε ή να μετατρέψετε τις στήλες μεταδεδομένων σε λειτουργικά χαρακτηριστικά μέσω της μηχανικής χαρακτηριστικών.

Παράδειγμα 1: Χρηματοοικονομική Μοντελοποίηση

Ακατέργαστα δεδομένα για εκπαίδευση μοντέλων ML

Για παράδειγμα, στην παραπάνω εικόνα ενός παραδείγματος συνόλου δεδομένων, οι στήλες από το A έως το G είναι χαρακτηριστικά. Οι τιμές ή οι συμβολοσειρές κειμένου σε κάθε στήλη κατά μήκος των γραμμών, όπως ονόματα, ποσό κατάθεσης, έτη κατάθεσης, επιτόκια κ.λπ., είναι παρατηρήσεις.

Στη μοντελοποίηση ML, πρέπει να διαγράψετε, να προσθέσετε, να συνδυάσετε ή να μετασχηματίσετε δεδομένα για να δημιουργήσετε σημαντικές λειτουργίες και να μειώσετε το μέγεθος της συνολικής βάσης δεδομένων εκπαίδευσης μοντέλων. Αυτή είναι η μηχανική χαρακτηριστικών.

Παράδειγμα μηχανικής χαρακτηριστικών

Στο ίδιο σύνολο δεδομένων που αναφέρθηκε προηγουμένως, χαρακτηριστικά όπως το Σύνολο θητείας και το Ποσό Τόκου είναι περιττές εισροές. Αυτά απλώς θα καταλάβουν περισσότερο χώρο και θα μπερδέψουν το μοντέλο ML. Έτσι, μπορείτε να μειώσετε δύο δυνατότητες από ένα σύνολο επτά λειτουργιών.

Δεδομένου ότι οι βάσεις δεδομένων στα μοντέλα ML περιέχουν χιλιάδες στήλες και εκατομμύρια σειρές, η μείωση δύο χαρακτηριστικών επηρεάζει πολύ το έργο.

Παράδειγμα 2: Δημιουργός λίστας αναπαραγωγής μουσικής AI

Μερικές φορές, μπορείτε να δημιουργήσετε μια εντελώς νέα δυνατότητα από πολλές υπάρχουσες λειτουργίες. Ας υποθέσουμε ότι δημιουργείτε ένα μοντέλο τεχνητής νοημοσύνης που θα δημιουργεί αυτόματα μια λίστα αναπαραγωγής μουσικής και τραγουδιών ανάλογα με το γεγονός, το γούστο, τη λειτουργία κ.λπ.

[Resolved] Το πληκτρολόγιο φορητού υπολογιστή δεν λειτουργεί: 9 εύκολες επιδιορθώσεις

Τώρα, συλλέξατε δεδομένα για τραγούδια και μουσική από διάφορες πηγές και δημιουργήσατε την ακόλουθη βάση δεδομένων:

Υπάρχουν επτά χαρακτηριστικά στην παραπάνω βάση δεδομένων. Ωστόσο, δεδομένου ότι ο στόχος σας είναι να εκπαιδεύσετε το μοντέλο ML για να αποφασίσετε ποιο τραγούδι ή μουσική είναι κατάλληλο για ποια εκδήλωση, μπορείτε να συλλέξετε χαρακτηριστικά όπως Είδος, Βαθμολογία, Beats, Τέμπο και Ταχύτητα σε μια νέα δυνατότητα που ονομάζεται Εφαρμογή.

Τώρα, είτε μέσω τεχνογνωσίας είτε μέσω αναγνώρισης μοτίβων, μπορείτε να συνδυάσετε ορισμένες περιπτώσεις χαρακτηριστικών για να προσδιορίσετε ποιο τραγούδι είναι κατάλληλο για ποιο συμβάν. Για παράδειγμα, παρατηρήσεις όπως τα Jazz, 4.9, X3, Y3 και Z1 λένε στο μοντέλο ML ότι το τραγούδι Cras maximus justo et θα πρέπει να βρίσκεται στη λίστα αναπαραγωγής του χρήστη εάν αναζητά ένα τραγούδι για τον ύπνο.

Τύποι χαρακτηριστικών στη Μηχανική Εκμάθηση

Κατηγορικά Χαρακτηριστικά

Αυτά είναι χαρακτηριστικά δεδομένων που αντιπροσωπεύουν διακριτές κατηγορίες ή ετικέτες. Πρέπει να χρησιμοποιήσετε αυτόν τον τύπο για να προσθέσετε ετικέτες σε ποιοτικά σύνολα δεδομένων.

#1. Τακτικά Κατηγορικά Χαρακτηριστικά

Τα τακτικά χαρακτηριστικά έχουν κατηγορίες με ουσιαστική σειρά. Για παράδειγμα, τα επίπεδα εκπαίδευσης όπως το Λύκειο, το Πτυχίο, το Μεταπτυχιακό κ.λπ., έχουν σαφή διάκριση στα πρότυπα, αλλά δεν υπάρχουν ποσοτικές διαφορές.

#2. Ονομαστικά Κατηγορικά Χαρακτηριστικά

Τα ονομαστικά χαρακτηριστικά είναι κατηγορίες χωρίς καμία εγγενή σειρά. Παραδείγματα μπορεί να είναι χρώματα, χώρες ή τύποι ζώων. Επίσης, υπάρχουν μόνο ποιοτικές διαφορές.

Χαρακτηριστικά πίνακα

Αυτός ο τύπος χαρακτηριστικών αντιπροσωπεύει δεδομένα οργανωμένα σε πίνακες ή λίστες. Οι επιστήμονες δεδομένων και οι προγραμματιστές ML χρησιμοποιούν συχνά τις δυνατότητες Array για να χειριστούν ακολουθίες ή να ενσωματώσουν κατηγορικά δεδομένα.

#1. Ενσωμάτωση δυνατοτήτων πίνακα

Οι πίνακες ενσωμάτωσης μετατρέπουν κατηγορηματικά δεδομένα σε πυκνά διανύσματα. Χρησιμοποιείται συνήθως σε συστήματα επεξεργασίας και συστάσεων φυσικής γλώσσας.

#2. Λίστα δυνατοτήτων πίνακα

Οι πίνακες λιστών αποθηκεύουν ακολουθίες δεδομένων, όπως λίστες στοιχείων σε μια παραγγελία ή το ιστορικό ενεργειών.

Αριθμητικά χαρακτηριστικά

Αυτά τα χαρακτηριστικά εκπαίδευσης ML χρησιμοποιούνται για την εκτέλεση μαθηματικών πράξεων, καθώς αυτά τα χαρακτηριστικά αντιπροσωπεύουν ποσοτικά δεδομένα.

#1. Αριθμητικά χαρακτηριστικά διαστήματος

Τα χαρακτηριστικά διαστήματος έχουν σταθερά διαστήματα μεταξύ των τιμών αλλά όχι πραγματικό σημείο μηδέν—για παράδειγμα, δεδομένα παρακολούθησης θερμοκρασίας. Εδώ, το μηδέν σημαίνει θερμοκρασία παγώματος, αλλά το χαρακτηριστικό εξακολουθεί να υπάρχει.

#2. Αναλογία Αριθμητικά χαρακτηριστικά

Τα χαρακτηριστικά αναλογίας έχουν σταθερά διαστήματα μεταξύ των τιμών και ενός πραγματικού σημείου μηδέν. Παραδείγματα περιλαμβάνουν την ηλικία, το ύψος και το εισόδημα.

Σημασία της Μηχανικής Χαρακτηριστικών στην ML και την Επιστήμη Δεδομένων

Η αποτελεσματική εξαγωγή χαρακτηριστικών βελτιώνει την ακρίβεια του μοντέλου, καθιστώντας τις προβλέψεις πιο αξιόπιστες και πολύτιμες για τη λήψη αποφάσεων.

Η προσεκτική επιλογή χαρακτηριστικών εξαλείφει άσχετα ή περιττά χαρακτηριστικά, απλοποιώντας τα μοντέλα και εξοικονομώντας υπολογιστικούς πόρους.

Τα καλά σχεδιασμένα χαρακτηριστικά αποκαλύπτουν μοτίβα δεδομένων, βοηθώντας τους επιστήμονες δεδομένων να κατανοήσουν πολύπλοκες σχέσεις μέσα στο σύνολο δεδομένων.

Η προσαρμογή των χαρακτηριστικών σε συγκεκριμένους αλγόριθμους μπορεί να βελτιστοποιήσει την απόδοση του μοντέλου σε διάφορες μεθόδους μηχανικής μάθησης.

Τα καλά σχεδιασμένα χαρακτηριστικά οδηγούν σε ταχύτερη εκπαίδευση μοντέλων και μειωμένο υπολογιστικό κόστος, βελτιστοποιώντας τη ροή εργασίας ML.

Στη συνέχεια, θα εξερευνήσουμε τη διαδικασία βήμα προς βήμα της μηχανικής χαρακτηριστικών.

Διαδικασία Μηχανικής Χαρακτηριστικών Βήμα-Βήμα

Συλλογή δεδομένων: Το αρχικό βήμα περιλαμβάνει τη συλλογή ακατέργαστων δεδομένων από διάφορες πηγές, όπως βάσεις δεδομένων, αρχεία ή API.

Καθαρισμός δεδομένων: Αφού λάβετε τα δεδομένα σας, πρέπει να τα καθαρίσετε εντοπίζοντας και διορθώνοντας τυχόν σφάλματα, ασυνέπειες ή ακραίες τιμές.

Χειρισμός τιμών που λείπουν: Οι τιμές που λείπουν μπορεί να μπερδέψουν το χώρο αποθήκευσης χαρακτηριστικών του μοντέλου ML. Αν τα αγνοήσετε, το μοντέλο σας θα είναι προκατειλημμένο. Επομένως, πρέπει να ερευνήσετε περισσότερο για να εισαγάγετε τις τιμές που λείπουν ή να τις παραλείψετε προσεκτικά χωρίς να επηρεάσετε το μοντέλο με προκατάληψη.

Κωδικοποίηση κατηγορικών μεταβλητών: Πρέπει να μετατρέψετε τις κατηγορικές μεταβλητές σε αριθμητική μορφή για αλγόριθμους μηχανικής εκμάθησης.

Κλιμάκωση και κανονικοποίηση: Η κλιμάκωση διασφαλίζει ότι τα αριθμητικά χαρακτηριστικά βρίσκονται σε συνεπή κλίμακα. Αποτρέπει χαρακτηριστικά με μεγάλες τιμές από το να κυριαρχούν στο μοντέλο μηχανικής μάθησης.

Επιλογή χαρακτηριστικών: Αυτό το βήμα βοηθά στον εντοπισμό και τη διατήρηση των πιο σχετικών χαρακτηριστικών, μειώνοντας τις διαστάσεις και βελτιώνοντας την απόδοση του μοντέλου.

Δημιουργία δυνατοτήτων: Μερικές φορές, νέες δυνατότητες μπορούν να δημιουργηθούν από τις υπάρχουσες για να συλλάβουν πολύτιμες πληροφορίες.

Μετασχηματισμός χαρακτηριστικών: Οι τεχνικές μετασχηματισμού όπως οι λογάριθμοι ή οι μετασχηματισμοί ισχύος μπορούν να κάνουν τα δεδομένα σας πιο κατάλληλα για μοντελοποίηση.

Πώς να διορθώσετε το βρόχο εκκίνησης του iPhone από το σφάλμα χαρακτήρων των Τελούγκου

Στη συνέχεια, θα συζητήσουμε τις μεθόδους μηχανικής χαρακτηριστικών.

Μέθοδοι Μηχανικής Χαρακτηριστικών

#1. Ανάλυση κύριου στοιχείου (PCA)

Το PCA απλοποιεί πολύπλοκα δεδομένα βρίσκοντας νέα μη συσχετισμένα χαρακτηριστικά. Αυτά ονομάζονται κύρια συστατικά. Μπορείτε να το χρησιμοποιήσετε για να μειώσετε τις διαστάσεις και να βελτιώσετε την απόδοση του μοντέλου.

#2. Πολυωνυμικά χαρακτηριστικά

Η δημιουργία πολυωνυμικών χαρακτηριστικών σημαίνει την προσθήκη δυνατοτήτων υπαρχόντων χαρακτηριστικών για την καταγραφή σύνθετων σχέσεων στα δεδομένα σας. Βοηθά το μοντέλο σας να κατανοήσει τα μη γραμμικά μοτίβα.

#3. Χειρισμός ακραίων στοιχείων

Τα ακραία σημεία είναι ασυνήθιστα σημεία δεδομένων που μπορούν να επηρεάσουν την απόδοση των μοντέλων σας. Πρέπει να προσδιορίσετε και να διαχειριστείτε τις ακραίες τιμές για να αποτρέψετε τα λοξά αποτελέσματα.

#4. Μετασχηματισμός καταγραφής

Ο λογαριθμικός μετασχηματισμός μπορεί να σας βοηθήσει να κανονικοποιήσετε τα δεδομένα με μια λοξή κατανομή. Μειώνει τον αντίκτυπο των ακραίων τιμών για να κάνει τα δεδομένα πιο κατάλληλα για μοντελοποίηση.

#5. t-Distributed Stochastic Neighbor Embedding (t-SNE)

Το t-SNE είναι χρήσιμο για την οπτικοποίηση δεδομένων υψηλών διαστάσεων. Μειώνει τις διαστάσεις και κάνει τα συμπλέγματα πιο εμφανή, διατηρώντας παράλληλα τη δομή δεδομένων.

Σε αυτήν τη μέθοδο εξαγωγής χαρακτηριστικών, αντιπροσωπεύετε τα σημεία δεδομένων ως κουκκίδες σε χώρο χαμηλότερης διάστασης. Στη συνέχεια, τοποθετείτε τα παρόμοια σημεία δεδομένων στον αρχικό χώρο υψηλών διαστάσεων και διαμορφώνονται έτσι ώστε να είναι κοντά το ένα στο άλλο στην αναπαράσταση χαμηλότερης διάστασης.

Διαφέρει από άλλες μεθόδους μείωσης διαστάσεων διατηρώντας τη δομή και τις αποστάσεις μεταξύ των σημείων δεδομένων.

#6. Κωδικοποίηση One-Hot

Η κωδικοποίηση One-hot μετατρέπει τις κατηγορικές μεταβλητές σε δυαδική μορφή (0 ή 1). Έτσι, λαμβάνετε νέες δυαδικές στήλες για κάθε κατηγορία. Η κωδικοποίηση One-hot καθιστά τα κατηγορικά δεδομένα κατάλληλα για αλγόριθμους ML.

#7. Κωδικοποίηση καταμέτρησης

Η κωδικοποίηση πλήθους αντικαθιστά τις κατηγορικές τιμές με τον αριθμό των φορών που εμφανίζονται στο σύνολο δεδομένων. Μπορεί να συλλάβει πολύτιμες πληροφορίες από κατηγορικές μεταβλητές.

Σε αυτήν τη μέθοδο μηχανικής χαρακτηριστικών, χρησιμοποιείτε τη συχνότητα ή τον αριθμό κάθε κατηγορίας ως νέο αριθμητικό χαρακτηριστικό αντί να χρησιμοποιείτε τις αρχικές ετικέτες κατηγορίας.

#8. Τυποποίηση χαρακτηριστικών

Τα χαρακτηριστικά μεγαλύτερων αξιών συχνά κυριαρχούν στα χαρακτηριστικά των μικρών αξιών. Έτσι, το μοντέλο ML μπορεί εύκολα να γίνει μεροληπτικό. Η τυποποίηση αποτρέπει τέτοιες αιτίες μεροληψίας σε ένα μοντέλο μηχανικής μάθησης.

Η διαδικασία τυποποίησης περιλαμβάνει συνήθως τις ακόλουθες δύο κοινές τεχνικές:

Τυποποίηση βαθμολογίας Z: Αυτή η μέθοδος μετασχηματίζει κάθε χαρακτηριστικό έτσι ώστε να έχει μέσο όρο (μέσος όρος) 0 και τυπική απόκλιση 1. Εδώ, αφαιρείτε τη μέση τιμή του χαρακτηριστικού από κάθε σημείο δεδομένων και διαιρείτε το αποτέλεσμα με την τυπική απόκλιση.
Min-Max Scaling: Η ελάχιστη μέγιστη κλίμακα μετατρέπει τα δεδομένα σε ένα συγκεκριμένο εύρος, συνήθως μεταξύ 0 και 1. Μπορείτε να το επιτύχετε αφαιρώντας την ελάχιστη τιμή της δυνατότητας από κάθε σημείο δεδομένων και διαιρώντας με το εύρος.

#9. Ομαλοποίηση

Μέσω της κανονικοποίησης, τα αριθμητικά χαρακτηριστικά κλιμακώνονται σε ένα κοινό εύρος, συνήθως μεταξύ 0 και 1. Διατηρεί τις σχετικές διαφορές μεταξύ των τιμών και διασφαλίζει ότι όλα τα χαρακτηριστικά βρίσκονται σε ίσους όρους ανταγωνισμού.

6 καλύτεροι δωρεάν διακομιστές Syslog για πειραματισμό το 2020

#1. Εργαλεία λειτουργιών

Εργαλεία λειτουργιών είναι ένα πλαίσιο Python ανοιχτού κώδικα που δημιουργεί αυτόματα χαρακτηριστικά από χρονικά και σχεσιακά σύνολα δεδομένων. Μπορεί να χρησιμοποιηθεί με εργαλεία που χρησιμοποιείτε ήδη για την ανάπτυξη αγωγών ML.

Η λύση χρησιμοποιεί Deep Feature Synthesis για την αυτοματοποίηση της μηχανικής χαρακτηριστικών. Διαθέτει μια βιβλιοθήκη με λειτουργίες χαμηλού επιπέδου για τη δημιουργία λειτουργιών. Το Featuretools διαθέτει επίσης ένα API, το οποίο είναι επίσης ιδανικό για ακριβή χειρισμό του χρόνου.

#2. CatBoost

Αν ψάχνετε για μια βιβλιοθήκη ανοιχτού κώδικα που συνδυάζει πολλαπλά δέντρα αποφάσεων για να δημιουργήσετε ένα ισχυρό μοντέλο πρόβλεψης, επιλέξτε CatBoost. Αυτή η λύση προσφέρει ακριβή αποτελέσματα με προεπιλεγμένες παραμέτρους, επομένως δεν χρειάζεται να ξοδεύετε ώρες για να προσαρμόσετε τις παραμέτρους.

Το CatBoost σάς επιτρέπει επίσης να χρησιμοποιείτε μη αριθμητικούς παράγοντες για να βελτιώσετε τα αποτελέσματα της προπόνησής σας. Με αυτό, μπορείτε επίσης να περιμένετε να λαμβάνετε πιο ακριβή αποτελέσματα και γρήγορες προβλέψεις.

#3. Χαρακτηριστικό-Μηχανή

Χαρακτηριστικό-Μηχανή είναι μια βιβλιοθήκη Python με πολλούς μετασχηματιστές και επιλεγμένες δυνατότητες που μπορείτε να χρησιμοποιήσετε για μοντέλα ML. Οι μετασχηματιστές που περιλαμβάνει μπορούν να χρησιμοποιηθούν για μετασχηματισμό μεταβλητών, δημιουργία μεταβλητών, χαρακτηριστικά ημερομηνίας, προεπεξεργασία, κατηγορική κωδικοποίηση, περιορισμό ή αφαίρεση ακραίων τιμών και καταλογισμό δεδομένων που λείπουν. Είναι σε θέση να αναγνωρίζει αυτόματα αριθμητικές, κατηγορίες και μεταβλητές ημερομηνίας.

Πόροι μάθησης Feature Engineering

Διαδικτυακά μαθήματα και εικονικά μαθήματα

#1. Feature Engineering for Machine Learning στην Python: Datacamp

Αυτό το Datacamp μάθημα Μηχανικής Χαρακτηριστικών για Μηχανική Μάθηση στην Python σας δίνει τη δυνατότητα να δημιουργήσετε νέες δυνατότητες που βελτιώνουν τις επιδόσεις του μοντέλου Μηχανικής Εκμάθησης. Θα σας διδάξει να εκτελείτε μηχανική λειτουργιών και επεξεργασία δεδομένων για να αναπτύξετε εξελιγμένες εφαρμογές ML.

#2. Feature Engineering for Machine Learning: Udemy

Από το Μάθημα Feature Engineering for Machine Learningθα μάθετε θέματα όπως καταλογισμός, κωδικοποίηση μεταβλητών, εξαγωγή χαρακτηριστικών, διακριτοποίηση, λειτουργικότητα ημερομηνίας, ακραίες τιμές κ.λπ. Οι συμμετέχοντες θα μάθουν επίσης να εργάζονται με λοξές μεταβλητές και να αντιμετωπίζουν σπάνιες, μη εμφανείς και σπάνιες κατηγορίες.

#3. Feature Engineering: Pluralsight

Αυτό Πολυθεώρηση Η διαδρομή μάθησης έχει συνολικά έξι μαθήματα. Αυτά τα μαθήματα θα σας βοηθήσουν να μάθετε τη σημασία της μηχανικής χαρακτηριστικών στη ροή εργασιών ML, τους τρόπους εφαρμογής των τεχνικών της και την εξαγωγή χαρακτηριστικών από κείμενο και εικόνες.

#4. Επιλογή δυνατοτήτων για Μηχανική Μάθηση: Udemy

Με τη βοήθεια αυτού Udemy μάθημα, οι συμμετέχοντες μπορούν να μάθουν ανακάτεμα χαρακτηριστικών, φίλτρο, περιτύλιγμα και ενσωματωμένες μεθόδους, αναδρομική εξάλειψη χαρακτηριστικών και εξαντλητική αναζήτηση. Συζητά επίσης τεχνικές επιλογής χαρακτηριστικών, συμπεριλαμβανομένων αυτών με Python, Lasso και δέντρα αποφάσεων. Αυτό το μάθημα περιέχει 5,5 ώρες βίντεο κατά παραγγελία και 22 άρθρα.

#5. Feature Engineering for Machine Learning: Great Learning

Αυτό το μάθημα από Μεγάλη Μάθηση θα σας μυήσει στη μηχανική χαρακτηριστικών ενώ θα σας διδάξει σχετικά με την υπερδειγματοληψία και την υποδειγματοληψία. Επιπλέον, θα σας επιτρέψει να κάνετε πρακτικές ασκήσεις για τον συντονισμό μοντέλων.

#6. Feature Engineering: Coursera

Γίνε μελος Coursera μάθημα για τη χρήση των BigQuery ML, Keras και TensorFlow για την εκτέλεση μηχανικών χαρακτηριστικών. Αυτό το μάθημα μεσαίου επιπέδου καλύπτει επίσης πρακτικές μηχανικής προηγμένων χαρακτηριστικών.

Ψηφιακά ή σκληρά εξώφυλλα βιβλία

#1. Μηχανική Χαρακτηριστικών για Μηχανική Μάθηση

Αυτό το βιβλίο σάς διδάσκει πώς να μετατρέψετε χαρακτηριστικά σε μορφές για μοντέλα μηχανικής μάθησης.

Σας διδάσκει επίσης αρχές μηχανικής χαρακτηριστικών και πρακτική εφαρμογή μέσω της άσκησης.

#2. Μηχανική και Επιλογή Χαρακτηριστικών

Διαβάζοντας αυτό το βιβλίο, θα μάθετε τις μεθόδους ανάπτυξης προγνωστικών μοντέλων σε διαφορετικά στάδια.

Από αυτό, μπορείτε να μάθετε τεχνικές για την εύρεση των καλύτερων αναπαραστάσεων πρόβλεψης για μοντελοποίηση.

#3. Η Μηχανική Χαρακτηριστικών έγινε εύκολη

Το βιβλίο είναι ένας οδηγός για την ενίσχυση της προγνωστικής ισχύος των αλγορίθμων ML.

Σας διδάσκει να σχεδιάζετε και να δημιουργείτε αποτελεσματικές λειτουργίες για εφαρμογές που βασίζονται σε ML, προσφέροντας εις βάθος πληροφορίες δεδομένων.

#4. Feature Engineering Bookcamp

Αυτό το βιβλίο ασχολείται με πρακτικές περιπτωσιολογικές μελέτες για να σας διδάξει τεχνικές χαρακτηριστικών μηχανικής για καλύτερα αποτελέσματα ML και αναβαθμισμένη διαμάχη δεδομένων.

Διαβάζοντας αυτό θα διασφαλίσετε ότι μπορείτε να παραδώσετε βελτιωμένα αποτελέσματα χωρίς να ξοδεύετε πολύ χρόνο για να βελτιώσετε τις παραμέτρους ML.

#5. Η Τέχνη της Μηχανικής Χαρακτηριστικών

Ο πόρος λειτουργεί ως βασικό στοιχείο για κάθε επιστήμονα δεδομένων ή μηχανικό μηχανικής μάθησης.

Το βιβλίο χρησιμοποιεί μια προσέγγιση μεταξύ τομέων για να συζητήσει γραφήματα, κείμενα, χρονοσειρές, εικόνες και μελέτες περιπτώσεων.

συμπέρασμα

Έτσι, με αυτόν τον τρόπο μπορείτε να εκτελέσετε τη μηχανική χαρακτηριστικών. Τώρα που γνωρίζετε τον ορισμό, τη σταδιακή διαδικασία, τις μεθόδους και τους πόρους εκμάθησης, μπορείτε να τα εφαρμόσετε στα έργα σας ML και να δείτε την επιτυχία!

Στη συνέχεια, ρίξτε μια ματιά στο άρθρο για την ενισχυτική μάθηση.