Η Alexa, η Siri και η Google δεν καταλαβαίνουν μια λέξη που λέτε

Οι βοηθοί φωνής όπως η Alexa, ο Βοηθός Google και η Siri έχουν προχωρήσει πολύ τα τελευταία χρόνια. Όμως, παρ’ όλες τις βελτιώσεις τους, ένα πράγμα τους κρατά πίσω: Δεν σας καταλαβαίνουν. Βασίζονται πάρα πολύ σε συγκεκριμένες φωνητικές εντολές.

Πίνακας περιεχομένων

Η αναγνώριση ομιλίας είναι απλώς ένα μαγικό κόλπο

Οι βοηθοί φωνής δεν σας καταλαβαίνουν. Όχι πραγματικά, ούτως ή άλλως. Όταν μιλάτε σε Google Home ή Amazon Echo, ουσιαστικά μετατρέπει τις λέξεις σας σε μια συμβολοσειρά κειμένου και στη συνέχεια τη συγκρίνει με τις αναμενόμενες εντολές. Εάν βρει μια ακριβή αντιστοίχιση, τότε ακολουθεί ένα σύνολο οδηγιών. Εάν δεν το κάνει, αναζητά μια εναλλακτική για το τι πρέπει να κάνει με βάση τις πληροφορίες που έχει και εάν αυτό δεν λειτουργήσει, λαμβάνετε ένα μήνυμα αποτυχίας όπως “Λυπάμαι, αλλά δεν το ξέρω .» Δεν είναι τίποτα περισσότερο από μια μαγεία των χεριών για να σας ξεγελάσει ώστε να πιστεύετε ότι καταλαβαίνει.

Δεν μπορεί να χρησιμοποιήσει ενδείξεις με βάση τα συμφραζόμενα για να κάνει την καλύτερη εικασία ή ακόμη και να χρησιμοποιήσει την κατανόηση παρόμοιων θεμάτων για να ενημερώσει τις αποφάσεις του. Δεν είναι δύσκολο να σκοντάψεις και τους βοηθούς φωνής. Ενώ μπορείτε να ρωτήσετε την Alexa “Εργάζεστε για την NSA;” και λάβετε μια απάντηση, εάν ρωτήσετε “Είστε κρυφά μέλος της NSA;” λαμβάνετε μια απάντηση “Δεν το ξέρω αυτό” (τουλάχιστον τη στιγμή που γράφω αυτό το άρθρο).

Οι άνθρωποι, που καταλαβαίνουν ειλικρινά την ομιλία, δεν λειτουργούν έτσι. Ας υποθέσουμε ότι ρωτάτε έναν άνθρωπο, «Τι είναι αυτό το κλάρβα στον ουρανό; Αυτό που είναι τοξωτό και γεμάτο ριγέ χρώματα όπως κόκκινο, πορτοκαλί, κίτρινο και μπλε.» Παρά το γεγονός ότι το klarvain είναι μια φτιαχτή λέξη, το άτομο που ρωτήσατε θα μπορούσε πιθανότατα να καταλάβει από τα συμφραζόμενα ότι περιγράφετε ένα ουράνιο τόξο.

Πώς να διορθώσετε το σφάλμα "Κάτι πήγε στραβά κατά τη λήψη του προτύπου σας".

Ενώ θα μπορούσατε να υποστηρίξετε ότι ένας άνθρωπος μετατρέπει την ομιλία σε ιδέες, ένας άνθρωπος μπορεί στη συνέχεια να εφαρμόσει τη γνώση και την κατανόηση για να καταλήξει σε μια απάντηση. Αν ρωτήσετε έναν άνθρωπο εάν εργάζεται κρυφά για την NSA, θα σας απαντήσει ναι ή όχι, ακόμα κι αν αυτή η απάντηση είναι ψέμα. Ένας άνθρωπος δεν θα έλεγε «δεν το ξέρω αυτό» σε μια τέτοια ερώτηση. Το ότι οι άνθρωποι μπορούν να λένε ψέματα είναι κάτι που έρχεται με πραγματική κατανόηση.

Οι φωνητικοί βοηθοί δεν μπορούν να υπερβούν τον προγραμματισμό τους

Οι βοηθοί φωνής περιορίζονται τελικά σε προγραμματισμένες αναμενόμενες παραμέτρους και η περιπλάνηση έξω από αυτές θα σπάσει τη διαδικασία. Αυτό δείχνει πότε έρχονται συσκευές τρίτων κατασκευαστών για αναπαραγωγή. Συνήθως, η εντολή για αλληλεπίδραση με αυτά είναι πολύ δυσκίνητη, που ισοδυναμεί με «πείτε στον κατασκευαστή της συσκευής να δώσει εντολή σε προαιρετικό όρισμα». Ένα ακριβές παράδειγμα θα ήταν: «Πες στη Whirlpool να σταματήσει το στεγνωτήριο». Για ένα ακόμη πιο δύσκολο παράδειγμα, το Ικανότητα Alexa της Γενεύης ελέγχει ορισμένους φούρνους GE. Ένας χρήστης της ικανότητας πρέπει να θυμάται να “πείτε στη Γενεύη” και όχι να “πείτε στην GE” μετά την υπόλοιπη εντολή. Και ενώ μπορείτε να του ζητήσετε να προθερμάνει τον φούρνο στους 350 βαθμούς, δεν μπορείτε να ακολουθήσετε αίτημα για αύξηση της θερμοκρασίας κατά άλλους 50 βαθμούς. Ωστόσο, ένας άνθρωπος θα μπορούσε να ακολουθήσει αυτά τα αιτήματα.

Η Amazon και η Google έχουν εργαστεί πολύ σκληρά για να ξεπεράσουν αυτά τα εμπόδια, και αυτό φαίνεται. Όπου κάποτε έπρεπε να ακολουθήσετε την παραπάνω ακολουθία για να ελέγξετε μια έξυπνη κλειδαριά, τώρα μπορείτε να πείτε «κλείδωσε την μπροστινή πόρτα». Η Alexa συνήθιζε να μπερδεύεται με το «πες μου ένα σκυλί αστείο», αλλά ζητήστε ένα σήμερα και θα λειτουργήσει. Έχουν προσθέσει παραλλαγές στις εντολές που χρησιμοποιείτε, αλλά τελικά πρέπει να γνωρίζετε τη σωστή εντολή για να πείτε. Πρέπει να χρησιμοποιήσετε τη σωστή σύνταξη, με τη σωστή σειρά.

Διόρθωση: Το μικρόφωνό μου δεν λειτουργεί στα Windows 10

Και αν νομίζετε ότι ακούγεται πολύ σαν γραμμή εντολών, δεν κάνετε λάθος.

Οι Βοηθοί φωνής είναι μια φανταχτερή γραμμή εντολών

Μια γραμμή εντολών ορίζεται στενά για να εκτελεί απλές εργασίες, αλλά μόνο εάν γνωρίζετε τη σωστή σύνταξη. Εάν ξεφύγετε από τη σωστή σύνταξη και πληκτρολογήσετε dyr αντί για dir, τότε η γραμμή εντολών θα σας δώσει ένα μήνυμα σφάλματος. Μπορείτε να χρησιμοποιήσετε ψευδώνυμα για ευκολότερη απομνημόνευση εντολών, αλλά πρέπει να έχετε μια ιδέα για το ποιες ήταν οι αρχικές εντολές, πώς λειτουργούν και πώς να χρησιμοποιείτε αποτελεσματικά τα ψευδώνυμα. Εάν δεν αφιερώσετε χρόνο για να μάθετε τις λεπτομέρειες της γραμμής εντολών, δεν θα έχετε ποτέ πολλά οφέλη από αυτό.

Οι βοηθοί φωνής δεν διαφέρουν. Πρέπει να γνωρίζετε τον σωστό τρόπο για να πείτε μια εντολή ή να κάνετε μια ερώτηση. Και πρέπει να γνωρίζετε πώς να δημιουργείτε ομάδες για το Google και την Alexa, γιατί είναι απαραίτητη η ομαδοποίηση των συσκευών σας και πώς να ονομάζετε τις έξυπνες συσκευές σας. Εάν δεν ακολουθήσετε αυτά τα απαραίτητα βήματα, θα αισθανθείτε την απογοήτευση να ζητάτε από τον φωνητικό βοηθό σας να απενεργοποιήσει τη μελέτη μόνο και μόνο για να σας ρωτήσει «ποια μελέτη» πρέπει να απενεργοποιηθεί.

Ακόμη και όταν χρησιμοποιείτε τη σωστή σύνταξη με τη σωστή σειρά, η διαδικασία μπορεί να αποτύχει. Είτε με λάθος απάντηση που εκδόθηκε είτε με ένα εκπληκτικό αποτέλεσμα. Δύο Google Homes στο ίδιο σπίτι ενδέχεται να παρέχουν καιρό για ελαφρώς διαφορετικές τοποθεσίες, παρόλο που έχουν πρόσβαση στις ίδιες πληροφορίες λογαριασμού χρήστη και σύνδεση στο διαδίκτυο.

Στο παραπάνω παράδειγμα, δίνεται η εντολή «Ρύθμιση χρονοδιακόπτη για μισή ώρα». Ο διανομέας Google Home δημιούργησε ένα χρονόμετρο με το όνομα “Ώρα” και στη συνέχεια ρώτησε πόσο θα πρέπει να είναι το χρονόμετρο. Και όμως η επανάληψη της ίδιας εντολής άλλες τρεις φορές λειτούργησε σωστά και δημιούργησε ένα χρονόμετρο 30 λεπτών. Η χρήση της εντολής “Ρύθμιση χρονοδιακόπτη για 30 λεπτά” λειτουργεί σωστά σε πιο συνεπή βάση.

Πώς να επιταχύνετε τις λήψεις του PlayStation 4

Ενώ η ομιλία σε Google Home ή Echo μπορεί να είναι πιο ρευστή, οι βοηθοί φωνής κάτω από την κουκούλα και οι γραμμές εντολών λειτουργούν με τον ίδιο τρόπο. Μπορεί να μην χρειάζεται να μάθετε μια νέα γλώσσα, αλλά πρέπει να μάθετε μια νέα διάλεκτο.

Η στενή κατανόηση των φωνητικών βοηθών θα περιορίσει την ανάπτυξη

Τίποτα από αυτά δεν εμποδίζει τους βοηθούς φωνής όπως το Google Assistant και η Alexa να λειτουργούν αρκετά καλά (αν και η Cortana είναι διαφορετική ιστορία). Το Google Assistant και η Alexa και αναζητούν αξιοπρεπώς ερωτήσεις στο διαδίκτυο, αν και δεν αποτελεί έκπληξη ότι η Google είναι καλύτερη στην αναζήτηση και μπορεί να απαντήσει σε βασικές ερωτήσεις, όπως μετατροπές μετρήσεων και απλά μαθηματικά. Με ένα σωστά ρυθμισμένο έξυπνο σπίτι και καλά εκπαιδευμένο χρήστη, οι περισσότερες εντολές έξυπνου σπιτιού θα λειτουργούν όπως προβλέπεται. Αλλά αυτό προέκυψε με δουλειά και προσπάθεια, όχι με πνευματική κατανόηση.

Οι χρονομετρητές και οι συναγερμοί ήταν απλοϊκοί. Με την πάροδο του χρόνου προστέθηκε η ονομασία και στη συνέχεια η δυνατότητα προσθήκης χρόνου σε ένα χρονόμετρο. Πέρασαν από το απλοϊκό στο πιο περίπλοκο. Οι βοηθοί φωνής μπορούν να απαντήσουν σε περισσότερες ερωτήσεις και κάθε μέρα φέρνει νέες δεξιότητες και δυνατότητες. Αλλά αυτό δεν είναι προϊόν αυτο-ανάπτυξης που προέρχεται από τη μάθηση και την κατανόηση.

Και τίποτα από αυτά δεν παρέχει την εγγενή ικανότητα να χρησιμοποιήσει αυτό που είναι γνωστό για να φτάσει στο άγνωστο. Για κάθε εντολή και ερώτηση που λειτουργεί, θα υπάρχουν πάντα τρεις που δεν λειτουργούν. Χωρίς μια σημαντική ανακάλυψη στην τεχνητή νοημοσύνη που παρέχει μια ανθρώπινη ικανότητα κατανόησης, οι βοηθοί φωνής δεν είναι καθόλου βοηθοί. Είναι απλώς γραμμές φωνητικών εντολών—χρήσιμες στο σωστό σενάριο αλλά περιορίζονται σε εκείνα τα σενάρια που έχουν προγραμματιστεί να κατανοούν.

Με άλλα λόγια: οι μηχανές μαθαίνουν πράγματα, αλλά δεν μπορούν να τα καταλάβουν.