Εκμάθηση συνόλου που εξηγείται με απλούστερους δυνατούς όρους

Η εκμάθηση συνόλου μπορεί να σας βοηθήσει να πάρετε καλύτερες αποφάσεις και να λύσετε πολλές προκλήσεις της πραγματικής ζωής συνδυάζοντας αποφάσεις από διάφορα μοντέλα.

Η μηχανική μάθηση (ML) συνεχίζει να επεκτείνει τα φτερά της σε πολλούς τομείς και βιομηχανίες, είτε πρόκειται για οικονομικά, ιατρική, ανάπτυξη εφαρμογών ή ασφάλεια.

Η σωστή εκπαίδευση των μοντέλων ML θα σας βοηθήσει να επιτύχετε μεγαλύτερη επιτυχία στην επιχείρησή σας ή στον εργασιακό σας ρόλο, και υπάρχουν διάφορες μέθοδοι για να το πετύχετε.

Σε αυτό το άρθρο, θα συζητήσω την εκμάθηση συνόλου, τη σημασία της, περιπτώσεις χρήσης και τεχνικές.

Μείνετε συντονισμένοι!

Τι είναι το Ensemble Learning;

Στη μηχανική μάθηση και τη στατιστική, το “ensemble” αναφέρεται σε μεθόδους που δημιουργούν διάφορες υποθέσεις ενώ χρησιμοποιούν έναν κοινό βασικό μαθητή.

Και η εκμάθηση συνόλου είναι μια προσέγγιση μηχανικής μάθησης όπου πολλά μοντέλα (όπως ειδικοί ή ταξινομητές) δημιουργούνται στρατηγικά και συνδυάζονται με στόχο την επίλυση ενός υπολογιστικού προβλήματος ή την πραγματοποίηση καλύτερων προβλέψεων.

Αυτή η προσέγγιση επιδιώκει να βελτιώσει την πρόβλεψη, την προσέγγιση συναρτήσεων, την ταξινόμηση κ.λπ., την απόδοση ενός δεδομένου μοντέλου. Χρησιμοποιείται επίσης για να εξαλείψει την πιθανότητα να επιλέξετε ένα φτωχό ή λιγότερο πολύτιμο μοντέλο από πολλά. Για την επίτευξη βελτιωμένης προγνωστικής απόδοσης, χρησιμοποιούνται αρκετοί αλγόριθμοι μάθησης.

Σημασία της μάθησης συνόλου στην ML

Στα μοντέλα μηχανικής μάθησης, υπάρχουν ορισμένες πηγές όπως η μεροληψία, η διακύμανση και ο θόρυβος που μπορεί να προκαλέσουν σφάλματα. Η εκμάθηση συνόλου μπορεί να βοηθήσει στη μείωση αυτών των πηγών που προκαλούν σφάλματα και να διασφαλίσει τη σταθερότητα και την ακρίβεια των αλγορίθμων ML σας.

Εδώ είναι γιατί η εκμάθηση συνόλου χρησιμοποιείται σε διάφορα σενάρια:

Επιλέγοντας τον σωστό ταξινομητή

Η εκμάθηση συνόλου σάς βοηθά να επιλέξετε ένα καλύτερο μοντέλο ή ταξινομητή, ενώ μειώνει τον κίνδυνο που μπορεί να προκύψει λόγω κακής επιλογής μοντέλου.

Υπάρχουν διαφορετικοί τύποι ταξινομητών που χρησιμοποιούνται για διαφορετικά προβλήματα, όπως μηχανές διανύσματος υποστήριξης (SVM), πολυστρωματικό perceptron (MLP), απλοί ταξινομητές Bayes, δέντρα αποφάσεων κ.λπ. Επιπλέον, υπάρχουν διαφορετικές υλοποιήσεις αλγορίθμων ταξινόμησης που πρέπει να επιλέξετε . Η απόδοση διαφορετικών δεδομένων εκπαίδευσης μπορεί επίσης να είναι διαφορετική.

Αντί όμως να επιλέξετε μόνο ένα μοντέλο, εάν χρησιμοποιήσετε ένα σύνολο από όλα αυτά τα μοντέλα και συνδυάσετε τα μεμονωμένα αποτελέσματα τους, μπορεί να αποφύγετε την επιλογή φτωχότερων μοντέλων.

Όγκος δεδομένων

Πολλές μέθοδοι και μοντέλα ML δεν είναι τόσο αποτελεσματικά στα αποτελέσματά τους εάν τους τροφοδοτήσετε με ανεπαρκή δεδομένα ή μεγάλο όγκο δεδομένων.

Από την άλλη πλευρά, η εκμάθηση συνόλου μπορεί να λειτουργήσει και στα δύο σενάρια, ακόμα κι αν ο όγκος δεδομένων είναι πολύ μικρός ή πολύς.

  • Εάν δεν υπάρχουν επαρκή δεδομένα, μπορείτε να χρησιμοποιήσετε το bootstrapping για να εκπαιδεύσετε διάφορους ταξινομητές με τη βοήθεια διαφορετικών δειγμάτων δεδομένων εκκίνησης.
  • Εάν υπάρχει ένας μεγάλος όγκος δεδομένων που μπορεί να κάνει την εκπαίδευση ενός μεμονωμένου ταξινομητή δύσκολη, τότε μπορεί να χωρίσει στρατηγικά τα δεδομένα σε μικρότερα υποσύνολα.

Περίπλοκο

Ένας μεμονωμένος ταξινομητής μπορεί να μην είναι σε θέση να λύσει ορισμένα εξαιρετικά πολύπλοκα προβλήματα. Τα όρια απόφασής τους που διαχωρίζουν δεδομένα διαφόρων κλάσεων μπορεί να είναι πολύ περίπλοκα. Έτσι, εάν εφαρμόσετε έναν γραμμικό ταξινομητή σε ένα μη γραμμικό, σύνθετο όριο, δεν θα μπορεί να το μάθει.

Ωστόσο, όταν συνδυάσετε σωστά ένα σύνολο κατάλληλων, γραμμικών ταξινομητών, μπορείτε να το κάνετε να μάθει ένα δεδομένο μη γραμμικό όριο. Ο ταξινομητής θα χωρίσει τα δεδομένα σε πολλά εύχρηστα και μικρότερα διαμερίσματα και κάθε ταξινομητής θα μάθει μόνο ένα απλούστερο διαμέρισμα. Στη συνέχεια, διαφορετικοί ταξινομητές θα συνδυαστούν για να παραχθεί περίπου. όριο απόφασης.

  Επεξήγηση σε 5 λεπτά ή λιγότερο

Εκτίμηση Εμπιστοσύνης

Στην εκμάθηση συνόλου, εκχωρείται ψήφος εμπιστοσύνης σε μια απόφαση που έχει λάβει ένα σύστημα. Ας υποθέσουμε ότι έχετε ένα σύνολο από διάφορους ταξινομητές εκπαιδευμένους σε ένα δεδομένο πρόβλημα. Εάν η πλειοψηφία των ταξινομητών συμφωνεί με την απόφαση που ελήφθη, το αποτέλεσμά της μπορεί να θεωρηθεί ως ένα σύνολο με απόφαση υψηλής εμπιστοσύνης.

Από την άλλη πλευρά, εάν οι μισοί ταξινομητές δεν συμφωνούν με την απόφαση που ελήφθη, λέγεται ότι είναι ένα σύνολο με απόφαση χαμηλής εμπιστοσύνης.

Ωστόσο, η χαμηλή ή υψηλή εμπιστοσύνη δεν είναι πάντα η σωστή απόφαση. Αλλά υπάρχει μεγάλη πιθανότητα μια απόφαση με υψηλή σιγουριά να είναι σωστή εάν το σύνολο είναι σωστά εκπαιδευμένο.

Ακρίβεια με Data Fusion

Τα δεδομένα που συλλέγονται από πολλαπλές πηγές, όταν συνδυάζονται στρατηγικά, μπορούν να βελτιώσουν την ακρίβεια των αποφάσεων ταξινόμησης. Αυτή η ακρίβεια είναι υψηλότερη από αυτή που δημιουργείται με τη βοήθεια μιας μοναδικής πηγής δεδομένων.

Πώς λειτουργεί το Ensemble Learning;

Η εκμάθηση συνόλου παίρνει πολλαπλές συναρτήσεις χαρτογράφησης που έχουν μάθει διαφορετικοί ταξινομητές και στη συνέχεια τις συνδυάζει για να δημιουργήσει μια ενιαία συνάρτηση χαρτογράφησης.

Ακολουθεί ένα παράδειγμα για το πώς λειτουργεί η εκμάθηση συνόλου.

Παράδειγμα: Δημιουργείτε μια εφαρμογή βασισμένη σε τρόφιμα για τους τελικούς χρήστες. Για να προσφέρετε μια εμπειρία χρήστη υψηλής ποιότητας, θέλετε να συλλέξετε τα σχόλιά τους σχετικά με τα προβλήματα που αντιμετωπίζουν, τα εμφανή κενά, τα σφάλματα, τα σφάλματα κ.λπ.

Για αυτό, μπορείτε να ζητήσετε τη γνώμη της οικογένειάς σας, των φίλων, των συναδέλφων σας και άλλων ατόμων με τα οποία επικοινωνείτε συχνά σχετικά με τις επιλογές φαγητού και την εμπειρία τους από την παραγγελία φαγητού στο διαδίκτυο. Μπορείτε επίσης να κυκλοφορήσετε την εφαρμογή σας σε beta για να συλλέξετε σχόλια σε πραγματικό χρόνο χωρίς προκατάληψη ή θόρυβο.

Έτσι, αυτό που κάνετε στην πραγματικότητα εδώ είναι να εξετάζετε πολλές ιδέες και απόψεις από διαφορετικούς ανθρώπους για να βελτιώσετε την εμπειρία χρήστη.

Η εκμάθηση συνόλου και τα μοντέλα της λειτουργούν με παρόμοιο τρόπο. Χρησιμοποιεί ένα σύνολο μοντέλων και τα συνδυάζει για να παράγει ένα τελικό αποτέλεσμα για να βελτιώσει την ακρίβεια και την απόδοση της πρόβλεψης.

Βασικές τεχνικές εκμάθησης συνόλου

#1. Τρόπος

Μια “λειτουργία” είναι μια τιμή που εμφανίζεται σε ένα σύνολο δεδομένων. Στην εκμάθηση συνόλου, οι επαγγελματίες ML χρησιμοποιούν πολλά μοντέλα για να δημιουργήσουν προβλέψεις για κάθε σημείο δεδομένων. Αυτές οι προβλέψεις θεωρούνται μεμονωμένες ψήφοι και η πρόβλεψη που έχουν κάνει τα περισσότερα μοντέλα θεωρείται η τελική πρόβλεψη. Χρησιμοποιείται κυρίως σε προβλήματα ταξινόμησης.

Παράδειγμα: Τέσσερα άτομα βαθμολόγησαν την αίτησή σας με 4, ενώ ένα από αυτά την βαθμολόγησε με 3, τότε η λειτουργία θα ήταν 4 αφού η πλειοψηφία ψήφισε 4.

#2. Μέσος/Μέσος όρος

Χρησιμοποιώντας αυτή την τεχνική, οι επαγγελματίες λαμβάνουν υπόψη όλες τις προβλέψεις μοντέλων και υπολογίζουν τον μέσο όρο τους για να καταλήξουν στην τελική πρόβλεψη. Χρησιμοποιείται κυρίως για την πραγματοποίηση προβλέψεων για προβλήματα παλινδρόμησης, τον υπολογισμό πιθανοτήτων σε προβλήματα ταξινόμησης και πολλά άλλα.

Παράδειγμα: Στο παραπάνω παράδειγμα, όπου τέσσερα άτομα βαθμολόγησαν την εφαρμογή σας με 4 ενώ ένα άτομο την βαθμολόγησε με 3, ο μέσος όρος θα ήταν (4+4+4+4+3)/5=3,8

#3. Σταθμισμένος μέσος όρος

Σε αυτήν τη μέθοδο εκμάθησης συνόλου, οι επαγγελματίες κατανέμουν διαφορετικά βάρη σε διαφορετικά μοντέλα για να κάνουν μια πρόβλεψη. Εδώ, το κατανεμημένο βάρος περιγράφει τη συνάφεια κάθε μοντέλου.

Παράδειγμα: Ας υποθέσουμε ότι 5 άτομα έδωσαν σχόλια σχετικά με την αίτησή σας. Από αυτούς, οι 3 είναι προγραμματιστές εφαρμογών, ενώ οι 2 δεν έχουν εμπειρία ανάπτυξης εφαρμογών. Έτσι, η ανατροφοδότηση αυτών των 3 ατόμων θα έχει μεγαλύτερη βαρύτητα από τα υπόλοιπα 2.

Προηγμένες τεχνικές εκμάθησης συνόλου

#1. Σακκόπανο

Το Bagging (Bootstrap AGGregatING) είναι μια εξαιρετικά διαισθητική και απλή τεχνική εκμάθησης συνόλου με καλή απόδοση. Όπως υποδηλώνει το όνομα, δημιουργείται συνδυάζοντας δύο όρους “Bootstrap” και “aggregation”.

  Διαχειριστείτε τη Λογιστική, τη Μισθοδοσία και τους Υπαλλήλους της Επιχείρησής σας με το λογισμικό Patriot

Το bootstrapping είναι μια άλλη μέθοδος δειγματοληψίας όπου θα χρειαστεί να δημιουργήσετε υποσύνολα πολλών παρατηρήσεων που λαμβάνονται από ένα αρχικό σύνολο δεδομένων με αντικατάσταση. Εδώ, το μέγεθος του υποσυνόλου θα είναι το ίδιο με αυτό του αρχικού συνόλου δεδομένων.

Πηγή: Buggy programmer

Έτσι, στο bagging, τα υποσύνολα ή οι τσάντες χρησιμοποιούνται για την κατανόηση της κατανομής του πλήρους συνόλου. Ωστόσο, τα υποσύνολα θα μπορούσαν να είναι μικρότερα από το αρχικό σύνολο δεδομένων στο bagging. Αυτή η μέθοδος περιλαμβάνει έναν μόνο αλγόριθμο ML. Ο στόχος του συνδυασμού των αποτελεσμάτων διαφορετικών μοντέλων είναι να επιτευχθεί ένα γενικευμένο αποτέλεσμα.

Δείτε πώς λειτουργεί το bagging:

  • Πολλά υποσύνολα δημιουργούνται από το αρχικό σύνολο και οι παρατηρήσεις επιλέγονται με αντικαταστάσεις. Τα υποσύνολα χρησιμοποιούνται στην εκπαίδευση μοντέλων ή δέντρων αποφάσεων.
  • Ένα αδύναμο ή βασικό μοντέλο δημιουργείται για κάθε υποσύνολο. Τα μοντέλα θα είναι ανεξάρτητα το ένα από το άλλο και θα λειτουργούν παράλληλα.
  • Η τελική πρόβλεψη θα γίνει συνδυάζοντας κάθε πρόβλεψη από κάθε μοντέλο χρησιμοποιώντας στατιστικά όπως ο μέσος όρος, η ψηφοφορία κ.λπ.

Οι δημοφιλείς αλγόριθμοι που χρησιμοποιούνται σε αυτήν την τεχνική συνόλου είναι:

  • Τυχαίο δάσος
  • Σακουλωμένα δέντρα απόφασης

Το πλεονέκτημα αυτής της μεθόδου είναι ότι βοηθά στη διατήρηση των σφαλμάτων διακύμανσης στο ελάχιστο στα δέντρα απόφασης.

#2. Στοίβαξη

Πηγή εικόνας: OpenGenus IQ

Στη στοίβαξη ή τη γενίκευση στοίβαξης, οι προβλέψεις από διαφορετικά μοντέλα, όπως ένα δέντρο αποφάσεων, χρησιμοποιούνται για τη δημιουργία ενός νέου μοντέλου για την πραγματοποίηση προβλέψεων σε αυτό το σύνολο δοκιμής.

Η στοίβαξη περιλαμβάνει τη δημιουργία υποσυνόλων δεδομένων με bootstrapped για μοντέλα εκπαίδευσης, παρόμοια με το bagging. Αλλά εδώ, η έξοδος των μοντέλων λαμβάνεται ως είσοδος που θα τροφοδοτηθεί σε έναν άλλο ταξινομητή, γνωστό ως μετα-ταξινομητή για την τελική πρόβλεψη των δειγμάτων.

Ο λόγος για τον οποίο χρησιμοποιούνται δύο επίπεδα ταξινομητή είναι να καθοριστεί εάν τα σύνολα δεδομένων εκπαίδευσης μαθαίνονται κατάλληλα. Αν και η προσέγγιση δύο επιπέδων είναι κοινή, μπορούν επίσης να χρησιμοποιηθούν περισσότερα στρώματα.

Για παράδειγμα, μπορείτε να χρησιμοποιήσετε 3-5 μοντέλα στο πρώτο επίπεδο ή στο επίπεδο-1 και ένα μεμονωμένο μοντέλο στο επίπεδο 2 ή στο επίπεδο 2. Το τελευταίο θα συνδυάσει τις προβλέψεις που λαμβάνονται στο επίπεδο 1 για να κάνει την τελική πρόβλεψη.

Επιπλέον, μπορείτε να χρησιμοποιήσετε οποιοδήποτε μοντέλο εκμάθησης ML για τη συγκέντρωση προβλέψεων. Ένα γραμμικό μοντέλο όπως η γραμμική παλινδρόμηση, η λογιστική παλινδρόμηση, κ.λπ., είναι κοινό.

Οι δημοφιλείς αλγόριθμοι ML που χρησιμοποιούνται στη στοίβαξη είναι:

  • Ανάμειξη
  • Σούπερ σύνολο
  • Στοιβαγμένα μοντέλα

Σημείωση: Το Blending χρησιμοποιεί ένα σύνολο επικύρωσης ή κράτησης από το σύνολο δεδομένων εκπαίδευσης για την πραγματοποίηση προβλέψεων. Σε αντίθεση με το stacking, η ανάμειξη περιλαμβάνει προβλέψεις που πρέπει να γίνονται μόνο από το holdout.

#3. Ενίσχυση

Το Boosting είναι μια επαναληπτική μέθοδος εκμάθησης συνόλου που προσαρμόζει το βάρος μιας συγκεκριμένης παρατήρησης ανάλογα με την τελευταία ή την προηγούμενη ταξινόμησή της. Αυτό σημαίνει ότι κάθε επόμενο μοντέλο στοχεύει στη διόρθωση των σφαλμάτων που βρέθηκαν στο προηγούμενο μοντέλο.

Εάν η παρατήρηση δεν ταξινομηθεί σωστά, τότε η ενίσχυση αυξάνει το βάρος της παρατήρησης.

Στο boosting, οι επαγγελματίες εκπαιδεύουν τον πρώτο αλγόριθμο για την ενίσχυση σε ένα πλήρες σύνολο δεδομένων. Στη συνέχεια, κατασκευάζουν τους επόμενους αλγόριθμους ML χρησιμοποιώντας τα υπολείμματα που εξάγονται από τον προηγούμενο αλγόριθμο ενίσχυσης. Έτσι, δίνεται μεγαλύτερη βαρύτητα στις λανθασμένες παρατηρήσεις που προέβλεπε το προηγούμενο μοντέλο.

Δείτε πώς λειτουργεί σταδιακά:

  • Ένα υποσύνολο θα δημιουργηθεί από το αρχικό σύνολο δεδομένων. Κάθε σημείο δεδομένων θα έχει αρχικά τα ίδια βάρη.
  • Η δημιουργία ενός βασικού μοντέλου πραγματοποιείται στο υποσύνολο.
  • Η πρόβλεψη θα γίνει στο πλήρες σύνολο δεδομένων.
  • Χρησιμοποιώντας τις πραγματικές και τις προβλεπόμενες τιμές, θα υπολογιστούν τα σφάλματα.
  • Στις λανθασμένα προβλεπόμενες παρατηρήσεις θα δοθεί μεγαλύτερη βαρύτητα
  • Ένα νέο μοντέλο θα δημιουργηθεί και η τελική πρόβλεψη θα γίνει σε αυτό το σύνολο δεδομένων, ενώ το μοντέλο προσπαθεί να διορθώσει τα λάθη που έγιναν προηγουμένως. Θα δημιουργηθούν πολλά μοντέλα με παρόμοιο τρόπο, το καθένα διορθώνοντας τα προηγούμενα σφάλματα
  • Η τελική πρόβλεψη θα γίνει από το τελικό μοντέλο, που είναι ο σταθμισμένος μέσος όρος όλων των μοντέλων.
  Θυμάστε το MiniDisc; Δείτε πώς μπορείτε να το χρησιμοποιήσετε ακόμα το 2020

Οι δημοφιλείς αλγόριθμοι ενίσχυσης είναι:

  • CatBoost
  • Ελαφρύ GBM
  • AdaBoost

Το πλεονέκτημα της ενίσχυσης είναι ότι δημιουργεί ανώτερες προβλέψεις και μειώνει τα σφάλματα λόγω μεροληψίας.

Άλλες τεχνικές συνόλου

Ένα μείγμα Experts: χρησιμοποιείται για την εκπαίδευση πολλαπλών ταξινομητών και τα αποτελέσματα τους είναι σύνολο με έναν γενικό γραμμικό κανόνα. Εδώ, τα βάρη που δίνονται στους συνδυασμούς καθορίζονται από ένα εκπαιδευτικό μοντέλο.

Ψηφοφορία κατά πλειοψηφία: περιλαμβάνει την επιλογή ενός περιττού ταξινομητή και υπολογίζονται οι προβλέψεις για κάθε δείγμα. Η κλάση που θα λάβει τη μέγιστη κλάση από μια ομάδα ταξινομητή θα είναι η προβλεπόμενη τάξη του συνόλου. Χρησιμοποιείται για την επίλυση προβλημάτων όπως η δυαδική ταξινόμηση.

Κανόνας Max: χρησιμοποιεί τις κατανομές πιθανοτήτων κάθε ταξινομητή και χρησιμοποιεί εμπιστοσύνη για να κάνει προβλέψεις. Χρησιμοποιείται για προβλήματα ταξινόμησης πολλαπλών τάξεων.

Πραγματικές περιπτώσεις χρήσης συνόλου

#1. Ανίχνευση προσώπου και συναισθημάτων

Η εκμάθηση συνόλου χρησιμοποιεί τεχνικές όπως η ανάλυση ανεξάρτητων στοιχείων (ICA) για την εκτέλεση ανίχνευσης προσώπου.

Επιπλέον, η μάθηση συνόλου χρησιμοποιείται για την ανίχνευση του συναισθήματος ενός ατόμου μέσω της ανίχνευσης ομιλίας. Επιπλέον, οι δυνατότητές του βοηθούν τους χρήστες να πραγματοποιούν ανίχνευση συναισθημάτων προσώπου.

#2. Ασφάλεια

Ανίχνευση απάτης: Η εκμάθηση συνόλου συμβάλλει στην ενίσχυση της δύναμης της μοντελοποίησης κανονικής συμπεριφοράς. Αυτός είναι ο λόγος για τον οποίο θεωρείται αποτελεσματικό στον εντοπισμό δόλιων δραστηριοτήτων, για παράδειγμα, σε συστήματα πιστωτικών καρτών και τραπεζών, τηλεπικοινωνιακή απάτη, ξέπλυμα χρήματος κ.λπ.

DDoS: Η κατανεμημένη άρνηση υπηρεσίας (DDoS) είναι μια θανατηφόρα επίθεση σε έναν ISP. Οι ταξινομητές συνόλου μπορούν να μειώσουν τον εντοπισμό σφαλμάτων και επίσης να διακρίνουν τις επιθέσεις από την πραγματική κυκλοφορία.

Ανίχνευση εισβολών: Η εκμάθηση συνόλου μπορεί να χρησιμοποιηθεί σε συστήματα παρακολούθησης, όπως εργαλεία ανίχνευσης εισβολών για την ανίχνευση κωδικών εισβολέων μέσω παρακολούθησης δικτύων ή συστημάτων, εύρεσης ανωμαλιών και ούτω καθεξής.

Ανίχνευση κακόβουλου λογισμικού: Η εκμάθηση συνόλου είναι αρκετά αποτελεσματική για τον εντοπισμό και την ταξινόμηση κώδικα κακόβουλου λογισμικού όπως ιοί υπολογιστών και σκουλήκια, ransomware, δούρειοι ίπποι, λογισμικό κατασκοπείας κ.λπ. χρησιμοποιώντας τεχνικές μηχανικής εκμάθησης.

#3. Αυξητική Μάθηση

Στην επαυξητική μάθηση, ένας αλγόριθμος ML μαθαίνει από ένα νέο σύνολο δεδομένων, ενώ διατηρεί προηγούμενες γνώσεις, αλλά χωρίς να έχει πρόσβαση σε προηγούμενα δεδομένα που έχει δει. Τα συστήματα συνόλου χρησιμοποιούνται στη σταδιακή μάθηση, καθιστώντας το να μαθαίνει έναν πρόσθετο ταξινομητή σε κάθε σύνολο δεδομένων, καθώς αυτό γίνεται διαθέσιμο.

#4. Φάρμακο

Οι ταξινομητές συνόλου είναι χρήσιμοι στον τομέα της ιατρικής διάγνωσης, όπως η ανίχνευση νευρο-γνωστικών διαταραχών (όπως το Αλτσχάιμερ). Πραγματοποιεί ανίχνευση λαμβάνοντας σύνολα δεδομένων MRI ως είσοδο και ταξινομώντας την κυτταρολογία του τραχήλου της μήτρας. Εκτός από αυτό, εφαρμόζεται στην πρωτεϊνική (μελέτη πρωτεϊνών), τη νευροεπιστήμη και άλλους τομείς.

#5. Τηλεπισκόπηση

Ανίχνευση αλλαγών: Οι ταξινομητές συνόλου χρησιμοποιούνται για την εκτέλεση ανίχνευσης αλλαγών μέσω μεθόδων όπως ο μέσος όρος Bayes και η πλειοψηφία.

Χαρτογράφηση κάλυψης γης: Μέθοδοι εκμάθησης συνόλου, όπως η ενίσχυση, τα δέντρα αποφάσεων, η ανάλυση βασικών στοιχείων πυρήνα (KPCA) κ.λπ. χρησιμοποιούνται για την αποτελεσματική ανίχνευση και χαρτογράφηση της κάλυψης γης.

#6. Χρηματοδότηση

Η ακρίβεια είναι μια κρίσιμη πτυχή των οικονομικών, είτε πρόκειται για υπολογισμούς είτε για πρόβλεψη. Επηρεάζει πολύ το αποτέλεσμα των αποφάσεων που παίρνετε. Αυτά μπορούν επίσης να αναλύσουν τις αλλαγές στα δεδομένα της χρηματιστηριακής αγοράς, να εντοπίσουν χειραγώγηση στις τιμές των μετοχών και πολλά άλλα.

Πρόσθετοι πόροι μάθησης

#1. Ensemble Methods for Machine Learning

Αυτό το βιβλίο θα σας βοηθήσει να μάθετε και να εφαρμόσετε σημαντικές μεθόδους εκμάθησης συνόλου από την αρχή.

#2. Μέθοδοι συνόλου: Θεμέλια και Αλγόριθμοι

Αυτό το βιβλίο έχει τις βασικές αρχές της εκμάθησης συνόλου και τους αλγόριθμούς της. Περιγράφει επίσης πώς χρησιμοποιείται στον πραγματικό κόσμο.

#3. Εκμάθηση συνόλου

Προσφέρει μια εισαγωγή σε μια ενοποιημένη μέθοδο συνόλου, προκλήσεις, εφαρμογές κ.λπ.

#4. Ensemble Machine Learning: Μέθοδοι και Εφαρμογές:

Παρέχει ευρεία κάλυψη προηγμένων τεχνικών εκμάθησης συνόλου.

συμπέρασμα

Ελπίζω να έχετε τώρα κάποια ιδέα για την εκμάθηση συνόλου, τις μεθόδους της, τις περιπτώσεις χρήσης και γιατί η χρήση της μπορεί να είναι επωφελής για την περίπτωση χρήσης σας. Έχει τη δυνατότητα να λύσει πολλές προκλήσεις της πραγματικής ζωής, από τον τομέα της ασφάλειας και της ανάπτυξης εφαρμογών έως τη χρηματοδότηση, την ιατρική και πολλά άλλα. Οι χρήσεις του επεκτείνονται, επομένως είναι πιθανό να υπάρξει περισσότερη βελτίωση σε αυτή την ιδέα στο εγγύς μέλλον.

Μπορείτε επίσης να εξερευνήσετε ορισμένα εργαλεία για τη δημιουργία συνθετικών δεδομένων για την εκπαίδευση μοντέλων μηχανικής εκμάθησης