Πώς η Alexa ακούει τα Wake Words

Η Alexa ακούει πάντα αλλά δεν ηχογραφεί συνεχώς. Δεν στέλνει τίποτα σε διακομιστές cloud μέχρι να σας ακούσει να λέτε τη λέξη αφύπνισης (Alexa, Echo ή Computer). Αλλά το να ακούς λέξεις αφύπνισης είναι πιο δύσκολο από ό,τι φαντάζεσαι.

Το υλικό Echo δεν είναι τόσο έξυπνο. Χωρίς το διαδίκτυο, κάθε αίτημα ή ερώτηση που κάνετε θα αποτύχει. Αυτό συμβαίνει επειδή οι εντολές σας αποστέλλονται στο cloud για ερμηνεία και αποφάσεις. Η Amazon δεν θέλει να ηχογραφείται κάθε συνομιλία που έχετε μπροστά σε ένα έξυπνο ηχείο, αλλά μόνο οι εντολές που δίνετε στο έξυπνο ηχείο. Για το λόγο αυτό, η εταιρεία χρησιμοποιεί μια λέξη αφύπνισης για να τραβήξει την προσοχή του έξυπνου ηχείου. Για να το πετύχει αυτό, η Amazon χρησιμοποιεί έναν συνδυασμό βελτιωμένων μικροφώνων, μιας μικρής προσωρινής μνήμης και εκπαίδευσης νευρικού δικτύου.

Τα βελτιωμένα μικρόφωνα επισημαίνουν τη φωνή σας

Το γαλάζιο LED θα βλέπει πάντα την κατεύθυνση της φωνής σας.

Τα ηχεία με φωνητικό βοηθό, όπως το Echo και το Echo Dot, διαθέτουν συνήθως πολλά ενσωματωμένα μικρόφωνα. Το Echo Dot, για παράδειγμα, έχει επτά. Αυτή η συστοιχία δίνει στις συσκευές πολλές δυνατότητες, από ακρόαση εντολών που εκφωνούνται μακριά, έως διαχωρισμό του θορύβου περιβάλλοντος από τις φωνές.

Το τελευταίο είναι ιδιαίτερα χρήσιμο για την ανίχνευση λέξεων αφύπνισης. Χρησιμοποιώντας τα πολλαπλά μικρόφωνα του, το Echo μπορεί να εντοπίσει την τοποθεσία σας σε σχέση με το σημείο που κάθεται και να ακούσει προς αυτή την κατεύθυνση, ενώ αγνοεί το υπόλοιπο δωμάτιο.

  Πώς να διαγράψετε ένα απεσταλμένο μήνυμα στο Snapchat

Το βλέπετε σε δράση κάθε φορά που χρησιμοποιείτε τη λέξη αφύπνισης. Σταθείτε στο πλάι μιας Echo ή Echo Dot και πείτε τη λέξη αφύπνισης. Παρατηρήστε ότι το δαχτυλίδι ανάβει σε σκούρο μπλε και, στη συνέχεια, ένα πιο ανοιχτό μπλε καθώς κάνει κύκλους και «δείχνει» προς το μέρος σας. Τώρα, μετακινήστε αρκετά βήματα στο πλάι και πείτε ξανά τη λέξη αφύπνισης. Παρατηρήστε ότι τα γαλάζια φώτα σας ακολουθούν.

Το να γνωρίζετε πού βρίσκεστε, βοηθάει τη συσκευή να εστιάσει σε εσάς καλύτερα και συντονιστείτε τους θορύβους που προέρχονται από αλλού.

Η μικρή μνήμη εμποδίζει το ηχείο να κρατάει πολύ

Οι συσκευές Echo έχουν άφθονο χώρο αποθήκευσης, αλλά δεν χρησιμοποιούν πολύ από αυτόν. Σύμφωνα με τον Rohit Prasad, αντιπρόεδρο της Amazon και επικεφαλής επιστήμονα της Alexa Artificial Intelligence, an Echo μπορεί να αποθηκεύσει φυσικά μόνο μερικά δευτερόλεπτα ήχου.

Μειώνοντας τις δυνατότητές του, το Amazon όχι μόνο σας προσφέρει περισσότερο απόρρητο (είναι ένα μέρος λιγότερο που αποθηκεύεται η φωνή σας), αλλά επίσης εμποδίζει το Echo να ακούει ολόκληρες συνομιλίες, περιορίζοντας την εστίασή του στην εύρεση της λέξης αφύπνισης.

Φανταστείτε ότι είχατε μια κασέτα τριών δευτερολέπτων και ένα μαγνητόφωνο. Ας υποθέσουμε ότι αφού έφτασε στο τέλος, η ταινία γυρνούσε πίσω στην αρχή ξανά και ξανά. Εάν ξεκινούσατε να ηχογραφείτε μια συνομιλία, όλα όσα είπατε πριν από τέσσερα δευτερόλεπτα θα σβήνονταν και θα καταγραφόταν αμέσως. Αυτό κάνει ένα Amazon Echo.

Ηχογραφεί συνεχώς, αλλά ταυτόχρονα σκουπίζει όλα όσα μόλις κατέγραψε. Αυτό το σύντομο εύρος προσοχής σημαίνει ότι το μόνο που μπορεί να ακούσει είναι η λέξη «Alexa» και όχι πολλά άλλα. Τρία δευτερόλεπτα, ωστόσο, είναι αρκετά για να καταγραφεί, να εξεταστεί και να εφαρμοστεί κατάλληλα αυτή η λέξη.

  Πώς να ηχογραφήσετε φωνητικά μηνύματα σε λειτουργία Hands Free στο Whatsapp

Το Neural Net Training βοηθά στην αντιστοίχιση προτύπων

Μια αναπαράσταση των επιπέδων που χρησιμοποιούνται από τους αλγόριθμους της Amazon.

Τέλος, η Amazon εξαρτάται από εκπαίδευση νευρωνικών δικτύων για να διδάξει την Ηχώ πώς να ταιριάζει με μοτίβο. Όπως και άλλες μορφές μηχανικής μάθησης, η Amazon εκπαιδεύει τους αλγόριθμους της τροφοδοτώντας την κάθε φορά με τη λέξη Alexa (ή Υπολογιστής ή Echo, ανάλογα με τη λέξη αφύπνισης που εκπαιδεύει η εταιρεία).

Η ιδέα είναι να καλύψει κάθε κλίση και προφορά, αλλά και το πλαίσιο. Η Amazon θέλει το Echo σας να αναγνωρίζει τη διαφορά όταν του μιλάτε, όταν μιλάτε για αυτό ή, ίσως, όταν μιλάτε σε ένα άτομο που ονομάζεται Alexa. Τα κατευθυντικά μικρόφωνα βοηθούν επίσης σε αυτόν τον στόχο.

Με κάθε λέξη που ακούει το Echo, εκτελεί τον ήχο μέσα από στρώματα αλγορίθμων. Κάθε επίπεδο έχει σχεδιαστεί για να αποκλείει τα ψευδώς θετικά, αναζητώντας όμοιους ήχους ή ενδείξεις περιβάλλοντος. Εάν περάσει ο έλεγχος ενός επιπέδου, η λέξη πηγαίνει στο επόμενο. Τέλος, όταν η τοπική συσκευή αποφασίσει ότι άκουσε τη λέξη αφύπνισης, αρχίζει να καταγράφει και να μεταδίδει τον ήχο στους διακομιστές cloud της Amazon. Η Amazon χρησιμοποιεί τέσσερις αλγόριθμους: έναν για κάθε λέξη αφύπνισης (Alexa, Computer, Echo) και έναν για τον Alexa Guard, ο οποίος αντιμετωπίζει συγκεκριμένους ήχους, όπως το θραύση γυαλιού, σαν λέξη αφύπνισης.

Αλλά ακόμα και όταν συμβαίνει ένα ταίριασμα, η Amazon εξακολουθεί να εκτελεί πιο περίπλοκους ελέγχους. Έχετε παρατηρήσει ότι όταν κάποιος εκφωνεί τη λέξη Alexa σε μια τηλεοπτική εκπομπή ή διαφήμιση, συνήθως δεν προκαλεί απάντηση από τον Echo σας; Αυτό συμβαίνει επειδή η Amazon κάνει επίσης έλεγχο στο cloud.

  Πώς να αλλάξετε το όνομά σας στο Fortnite

Οι έλεγχοι στο cloud αποκλείουν ορισμένα ψευδώς θετικά

Αυτό ξεκαρδιστική διαφήμιση Alexa δεν θα ξυπνήσει η Ηχώ σας.

Όταν οι εταιρείες κάνουν διαφημίσεις που διαθέτουν Alexa, μπορούν υποβάλετε τον ήχο στο Amazon. Η εταιρεία εκτελεί τον ήχο μέσω παρόμοιων αλγορίθμων αντιστοίχισης προτύπων που χρησιμοποιούνται για την αναγνώριση της λέξης αφύπνισης. Μόλις αυτό το ακριβές παράδειγμα καταγραφεί πλήρως, προστίθεται σε μια βάση δεδομένων.

Ως μέρος της διαδικασίας προσέγγισης στο cloud, το Echo σας περιλαμβάνει πληροφορίες σχετικά με τη λέξη αφύπνισης που άκουσε και ελέγχει τη συγκεκριμένη βάση δεδομένων. Κάθε φορά που βρίσκει ένα ταίριασμα, η Amazon δίνει εντολή στο Echo σας να αγνοήσει τη λέξη αφύπνισης, να κλείσει και να απορρίψει τυχόν εγγεγραμμένο ήχο.

Επιπλέον, η Amazon ελέγχει για περιπτώσεις της λέξης αφύπνισης που εκφωνείται ταυτόχρονα. Δεν υποβάλλει κάθε εταιρεία ήχο στο Amazon, επομένως η εταιρεία βρήκε μια νέα λύση δημιουργίας αντιγράφων ασφαλείας. Αφού ελέγξει για αντιστοίχιση βάσης δεδομένων, η εταιρεία συγκρίνει το αποτύπωμα της λέξης αφύπνισης με οποιεσδήποτε άλλες εμφανίσεις έρχονται ταυτόχρονα. Είναι απίθανο δύο άτομα που λένε Alexa ταυτόχρονα να ακούγονται ακριβώς όμοια, οπότε αν υπάρχει ένα ταίριασμα, η Amazon γνωρίζει ότι πιθανότατα πρόκειται για διαφήμιση ή τηλεοπτική εκπομπή και αγνοεί το αίτημα.

Παρά όλους τους ελέγχους, εξακολουθούν να εμφανίζονται ψευδώς θετικά. Μπορείτε να ακούσετε τι έχει ηχογραφήσει το Echo σας Κόμβος απορρήτου της Amazon, και πιθανότατα θα βρείτε τουλάχιστον ένα ψευδώς θετικό στη δέσμη. Αλλά η τεχνολογία βελτιώνεται συνεχώς και, τελικά, η Amazon θα ήθελε να λειτουργεί χωρίς καμία λέξη αφύπνισης.