Πώς λειτουργεί η Αναγνώριση Προσώπου;

Οι περισσότεροι άνθρωποι αισθάνονται άνετα με την αναγνώριση προσώπου για τη χρήση της σε φίλτρα Instagram και Face ID. Αλλά αυτή η σχετικά νέα τεχνολογία μπορεί να φαίνεται λίγο ανατριχιαστική. Το πρόσωπό σας μοιάζει με δακτυλικό αποτύπωμα και η τεχνολογία πίσω από την αναγνώριση προσώπου είναι πολύπλοκη.

Όπως με κάθε νέα τεχνολογία, υπάρχουν μειονεκτήματα στην αναγνώριση προσώπου. Αυτά τα μειονεκτήματα γίνονται πιο εμφανή καθώς ο στρατός, η αστυνομία, διαφημιστές, και οι δημιουργοί deepfake, βρίσκουν πονηρούς νέους τρόπους για να επωφεληθούν από το λογισμικό αναγνώρισης προσώπου.

Τώρα, περισσότερο από ποτέ, είναι σημαντικό για τους ανθρώπους να κατανοήσουν πώς λειτουργεί η αναγνώριση προσώπου. Είναι επίσης σημαντικό να γνωρίζετε τους περιορισμούς της αναγνώρισης προσώπου και πώς θα εξελιχθεί στο μέλλον.

Πίνακας περιεχομένων

Η αναγνώριση προσώπου είναι εκπληκτικά απλή

Πριν ασχοληθείτε με τα πολλά διαφορετικά μέσα για την αναγνώριση προσώπου, είναι σημαντικό να κατανοήσετε πώς λειτουργεί η διαδικασία της αναγνώρισης προσώπου. Ακολουθούν τρεις εφαρμογές για λογισμικό αναγνώρισης προσώπου και μια απλή εξήγηση για το πώς αναγνωρίζουν ή αναγνωρίζουν πρόσωπα:

Βασική αναγνώριση προσώπου: Για τα φίλτρα Animoji και Instagram, η κάμερα του τηλεφώνου σας «αναζητά» τα καθοριστικά χαρακτηριστικά ενός προσώπου, συγκεκριμένα ένα ζευγάρι μάτια, μια μύτη και ένα στόμα. Στη συνέχεια, χρησιμοποιεί αλγόριθμους για να κλειδώσει σε ένα πρόσωπο και να καθορίσει ποια κατεύθυνση κοιτάζει, αν το στόμα του είναι ανοιχτό κ.λπ. Αξίζει να αναφέρουμε ότι αυτό δεν είναι αναγνώριση προσώπου, είναι απλώς λογισμικό που αναζητά πρόσωπα.
Face ID και παρόμοια προγράμματα: Όταν ρυθμίσετε το Face ID (ή παρόμοια προγράμματα) στο τηλέφωνό σας, τραβάει μια φωτογραφία του προσώπου σας και μετρά την απόσταση μεταξύ των χαρακτηριστικών του προσώπου σας. Στη συνέχεια, κάθε φορά που πηγαίνετε να ξεκλειδώσετε το τηλέφωνό σας, “κοιτάει” μέσα από την κάμερα για να μετρήσει και να επιβεβαιώσει την ταυτότητά σας.
Ταυτοποίηση ενός ξένου: Όταν ένας οργανισμός θέλει να αναγνωρίσει ένα πρόσωπο για λόγους ασφαλείας, διαφήμισης ή αστυνόμευσης, χρησιμοποιεί αλγόριθμους για να συγκρίνει αυτό το πρόσωπο με μια εκτενή βάση δεδομένων προσώπων. Αυτή η διαδικασία είναι σχεδόν πανομοιότυπη με το Face ID της Apple αλλά σε μεγαλύτερη κλίμακα. Θεωρητικά, θα μπορούσε να χρησιμοποιηθεί οποιαδήποτε βάση δεδομένων (ταυτότητες, προφίλ Facebook), αλλά μια βάση δεδομένων με καθαρές, προκαθορισμένες φωτογραφίες είναι ιδανική.

Εντάξει, ας μπούμε στο τσακωμό. Επειδή η «βασική αναγνώριση προσώπου» που χρησιμοποιείται για τα φίλτρα του Instagram είναι μια τόσο απλή και αβλαβής διαδικασία, θα επικεντρωθούμε αποκλειστικά στην αναγνώριση προσώπου και στις πολλές διαφορετικές τεχνολογίες που μπορούν να χρησιμοποιηθούν για την αναγνώριση ενός προσώπου.

Φιλτράρετε τα δεδομένα των Φύλλων Google χωρίς να αλλάξετε αυτό που βλέπουν οι συνεργάτες

Οι περισσότερες δυνατότητες αναγνώρισης προσώπου βασίζονται σε εικόνες 2D

Όπως θα περίμενε κανείς, το μεγαλύτερο μέρος του λογισμικού αναγνώρισης προσώπου βασίζεται εξ ολοκλήρου σε εικόνες 2D. Αλλά αυτό δεν γίνεται επειδή η 2D απεικόνιση προσώπου είναι εξαιρετικά ακριβής, γίνεται για λόγους ευκολίας. Η συντριπτική πλειονότητα των καμερών τραβάει φωτογραφίες χωρίς βάθος και οι δημόσιες φωτογραφίες που μπορούν να χρησιμοποιηθούν για βάσεις δεδομένων αναγνώρισης προσώπου (εικόνες προφίλ Facebook, για παράδειγμα) είναι όλες σε 2D.

Γιατί η 2D απεικόνιση προσώπου δεν είναι εξαιρετικά ακριβής; Λοιπόν, επειδή μια επίπεδη εικόνα του προσώπου σας δεν διαθέτει χαρακτηριστικά αναγνώρισης, όπως το βάθος. Με μια επίπεδη εικόνα, ένας υπολογιστής μπορεί να μετρήσει την απόσταση της κόρης σας και το πλάτος του στόματός σας, μεταξύ άλλων μεταβλητών. Αλλά δεν μπορεί να πει το μήκος της μύτης ή την προεξοχή του μετώπου σας.

Επιπλέον, η 2D απεικόνιση προσώπου βασίζεται στο φάσμα του ορατού φωτός. Αυτό σημαίνει ότι η 2D απεικόνιση προσώπου δεν λειτουργεί στο σκοτάδι και μπορεί να είναι αναξιόπιστη σε συνθήκες funky ή σκιερού φωτισμού.

Σαφώς, ο τρόπος αντιμετώπισης ορισμένων από αυτές τις ελλείψεις είναι η χρήση τρισδιάστατης απεικόνισης προσώπου. Πώς είναι όμως αυτό δυνατό; Χρειάζεστε ειδικό εξοπλισμό για να δείτε ένα πρόσωπο σε 3D;

Οι κάμερες υπερύθρων προσθέτουν βάθος στην ταυτότητά σας

Ενώ ορισμένες εφαρμογές αναγνώρισης προσώπου βασίζονται αποκλειστικά σε εικόνες 2D, δεν είναι ασυνήθιστο η αναγνώριση προσώπου να βασίζεται και στην τρισδιάστατη απεικόνιση. Στην πραγματικότητα, η εμπειρία σας με την αναγνώριση προσώπου πιθανότατα περιλαμβάνει ένα τσίμπημα 3D.

Αυτό επιτυγχάνεται μέσω μιας τεχνικής που ονομάζεται lidar, η οποία είναι παρόμοια με το σόναρ. Ουσιαστικά, οι συσκευές σάρωσης προσώπου, όπως το iPhone σας, εκτοξεύουν μια αβλαβή μήτρα υπερύθρων στο πρόσωπό σας. Αυτή η μήτρα (ένας τοίχος λέιζερ) αντανακλάται στη συνέχεια στο πρόσωπό σας και λαμβάνεται από μια κάμερα υπερύθρων (ή κάμερα ToF) στο τηλέφωνό σας.

Πού συμβαίνει η τρισδιάστατη μαγεία; Η κάμερα υπερύθρων του τηλεφώνου σας μετρά πόσο χρόνο χρειάζεται για να αναπηδήσει κάθε bit υπερύθρων από το πρόσωπό σας και να επιστρέψει στο τηλέφωνο. Φυσικά, το φως που αντανακλάται από τη μύτη σας θα έχει μικρότερο ταξίδι από το φως που αντανακλάται από τα αυτιά σας και η κάμερα IR χρησιμοποιεί αυτές τις πληροφορίες για να δημιουργήσει έναν μοναδικό χάρτη βάθους του προσώπου σας. Όταν χρησιμοποιείται παράλληλα με τη βασική απεικόνιση 2D, η τρισδιάστατη απεικόνιση μπορεί να αυξήσει σημαντικά την ακρίβεια του λογισμικού αναγνώρισης προσώπου.

Πώς να επιστρέψετε στη λειτουργία κύλισης στην επόμενη εικόνα στην εφαρμογή Φωτογραφίες στα Windows 10

Η απεικόνιση Lidar είναι μια περίεργη ιδέα που μπορεί να είναι δύσκολο να τυλίξεις το κεφάλι σου. Εάν βοηθάει, προσπαθήστε να φανταστείτε ότι το πλέγμα υπερύθρων από το τηλέφωνό σας (ή οποιαδήποτε συσκευή αναγνώρισης προσώπου) είναι παιχνίδι καρφίτσας. Όπως ένα παιχνίδι με καρφίτσα, το πρόσωπό σας αφήνει μια εσοχή στο πλέγμα υπερύθρων, όπου η μύτη σας είναι αισθητά πιο βαθιά από, ας πούμε, τα μάτια σας.

Η θερμική απεικόνιση επιτρέπει την αναγνώριση προσώπου να λειτουργεί τη νύχτα

Ένα από τα μειονεκτήματα της δισδιάστατης αναγνώρισης προσώπου είναι ότι βασίζεται στο ορατό φάσμα του φωτός. Με απλούς όρους, η βασική αναγνώριση προσώπου δεν λειτουργεί στο σκοτάδι. Αλλά αυτό μπορεί να επιλυθεί χρησιμοποιώντας μια κάμερα θερμικής απεικόνισης (ναι, όπως στο Tom Clancy).

«Περιμένετε ένα λεπτό», θα πείτε, «η θερμική απεικόνιση δεν βασίζεται στο φως υπερύθρων;» Ναι είναι. Αλλά οι κάμερες θερμικής απεικόνισης δεν εκπέμπουν εκρήξεις υπερύθρων. απλώς ανιχνεύουν το φως υπερύθρων που εκπέμπεται από αντικείμενα. Τα θερμά αντικείμενα εκπέμπουν έναν τόνο υπερύθρων φωτός, ενώ τα ψυχρά αντικείμενα εκπέμπουν αμελητέα ποσότητα υπερύθρου φωτός. Οι ακριβές κάμερες θερμικής απεικόνισης μπορούν ακόμη και να ανιχνεύσουν ανεπαίσθητες διαφορές θερμοκρασίας σε μια επιφάνεια, επομένως η τεχνολογία είναι ιδανική για αναγνώριση προσώπου.

Μια εικόνα φάσματος ορατού φωτός, μια θερμική εικόνα και μια σύνθετη θερμική εικόνα.

Υπάρχουν ένα μια χούφτα διαφορετικούς τρόπους για την αναγνώριση προσώπου με θερμική απεικόνιση. Όλες αυτές οι τεχνικές είναι απίστευτα περίπλοκες, αλλά έχουν κάποιες θεμελιώδεις ομοιότητες, επομένως θα προσπαθήσουμε να κρατήσουμε τα πράγματα απλά με μια λίστα:

Απαιτούνται πολλές φωτογραφίες: Μια κάμερα θερμικής απεικόνισης τραβάει πολλές φωτογραφίες του προσώπου ενός θέματος. Κάθε φωτογραφία εστιάζει σε διαφορετικό φάσμα υπερύθρων φωτός (μακρά, μικρά και μεσαία κύματα). Συνήθως, το φάσμα μακρών κυμάτων παρέχει τις περισσότερες λεπτομέρειες του προσώπου.
Οι χάρτες αιμοφόρων αγγείων είναι χρήσιμοι: Αυτές οι εικόνες υπερύθρων μπορούν επίσης να χρησιμοποιηθούν για την εξαγωγή του σχηματισμού αιμοφόρων αγγείων στο πρόσωπο ενός ατόμου. Είναι ανατριχιαστικό, αλλά οι χάρτες αιμοφόρων αγγείων μπορούν να χρησιμοποιηθούν σαν μοναδικά δακτυλικά αποτυπώματα προσώπου. Μπορούν επίσης να χρησιμοποιηθούν για την εύρεση της απόστασης μεταξύ των οργάνων του προσώπου (αν η τυπική θερμική απεικόνιση δίνει κακές εικόνες) ή για τον εντοπισμό μελανιών και ουλών.
Το θέμα μπορεί να αναγνωριστεί: Μια σύνθετη εικόνα (ή σύνολο δεδομένων) δημιουργείται χρησιμοποιώντας πολλαπλές εικόνες υπερύθρων. Αυτή η σύνθετη εικόνα μπορεί στη συνέχεια να συγκριθεί με μια βάση δεδομένων προσώπων για την αναγνώριση του θέματος.

Φυσικά, η θερμική αναγνώριση προσώπου χρησιμοποιείται συνήθως από τον στρατό, δεν είναι κάτι που θα βρείτε στο Khols και δεν είναι κάτι που θα έρθει με το επόμενο κινητό σας. Επιπλέον, η θερμική απεικόνιση δεν λειτουργεί καλά κατά τη διάρκεια της ημέρας (ή γενικά σε καλά φωτισμένα περιβάλλοντα), επομένως δεν έχει πολλές πιθανές εφαρμογές εκτός του στρατού.

Πώς να λάβετε μια ειδοποίηση όταν μια εντολή γραμμής εντολών έχει ολοκληρωθεί στα Windows 10

Περιορισμοί της Αναγνώρισης Προσώπου

Έχουμε αφιερώσει πολύ χρόνο μιλώντας για τις αδυναμίες της αναγνώρισης προσώπου. Όπως έχουμε δει από την IR και τη θερμική απεικόνιση, είναι δυνατό να ξεπεραστούν ορισμένοι από αυτούς τους περιορισμούς. Ωστόσο, εξακολουθούν να υπάρχουν μερικά προβλήματα που δεν έχουν λυθεί ακόμα:

Εμπόδιο: Όπως θα περίμενε κανείς, τα γυαλιά ηλίου και άλλα αξεσουάρ μπορούν να σκοντάψουν το λογισμικό αναγνώρισης προσώπου.
Πόζες: Η αναγνώριση προσώπου λειτουργεί καλύτερα με μια ουδέτερη, στραμμένη προς τα εμπρός εικόνα. Η κλίση ή η στροφή του κεφαλιού μπορεί να δυσχεράνει την αναγνώριση προσώπου, ακόμη και για λογισμικό αναγνώρισης που βασίζεται σε υπερύθρες. Επιπλέον, ένα χαμόγελο, τα φουσκωμένα μάγουλα ή οποιαδήποτε άλλη στάση μπορεί να αλλάξει τον τρόπο με τον οποίο ένας υπολογιστής μετρά το πρόσωπό σας.
Φως: Όλες οι μορφές αναγνώρισης προσώπου βασίζονται στο φως, είτε είναι ορατό φάσμα είτε υπέρυθρο φως. Ως αποτέλεσμα, οι περίεργες συνθήκες φωτισμού μπορούν να μειώσουν την ακρίβεια της αναγνώρισης του προσώπου. Αυτό μπορεί να αλλάξει, καθώς οι επιστήμονες αναπτύσσονται αυτήν τη στιγμή τεχνολογία αναγνώρισης προσώπου που βασίζεται σε σόναρ.
Η βάση δεδομένων: Χωρίς μια καλή βάση δεδομένων, η αναγνώριση προσώπου δεν μπορεί να λειτουργήσει. Σε αυτές τις ίδιες γραμμές, είναι αδύνατο να αναγνωρίσετε ένα πρόσωπο που δεν έχει αναγνωριστεί σωστά στο παρελθόν.
Επεξεργασία δεδομένων: Ανάλογα με το μέγεθος και τη μορφή μιας βάσης δεδομένων, μπορεί να χρειαστεί λίγος χρόνος μέχρι οι υπολογιστές να αναγνωρίσουν σωστά τα πρόσωπα. Σε ορισμένες περιπτώσεις, όπως η αστυνόμευση, οι περιορισμοί στην επεξεργασία δεδομένων περιορίζουν τη χρήση αναγνώρισης προσώπου για καθημερινές εφαρμογές (κάτι που είναι πιθανώς καλό).

Προς το παρόν, ο καλύτερος τρόπος για να παρακάμψετε αυτούς τους περιορισμούς είναι να χρησιμοποιήσετε άλλες μορφές αναγνώρισης σε συνδυασμό με την αναγνώριση προσώπου. Το τηλέφωνό σας θα ζητήσει έναν κωδικό πρόσβασης ή ένα δακτυλικό αποτύπωμα εάν δεν μπορεί να αναγνωρίσει το πρόσωπό σας και το κινεζική κυβέρνηση χρησιμοποιεί ταυτότητες και τεχνολογία παρακολούθησης για να κλείσει το περιθώριο σφάλματος που υπάρχει στο δίκτυο αναγνώρισης προσώπου του.

Στο μέλλον, οι επιστήμονες θα βρουν σίγουρα έναν τρόπο να ξεπεράσουν αυτά τα ζητήματα. Μπορούν να χρησιμοποιήσουν την τεχνολογία σόναρ μαζί με το lidar για να δημιουργήσουν τρισδιάστατους χάρτες προσώπων σε οποιοδήποτε περιβάλλον και μπορεί να βρουν τρόπους επεξεργασίας δεδομένων προσώπων (και αναγνώρισης αγνώστων) σε απίστευτα σύντομο χρονικό διάστημα. Είτε έτσι είτε αλλιώς, αυτή η τεχνολογία έχει πολλές δυνατότητες για κατάχρηση, οπότε αξίζει να παρακολουθείτε.

Πηγές: Πανεπιστήμιο της Ριέκα, The Electronic Frontier Foundation