Μπορείτε να κάνετε κάτι για αυτό;

Βασικά Takeaways

  • Οι πλατφόρμες μέσων κοινωνικής δικτύωσης πωλούν δεδομένα χρηστών σε εταιρείες τεχνητής νοημοσύνης για την εκπαίδευση μοντέλων παραγωγής τεχνητής νοημοσύνης, παρά τις ανησυχίες σχετικά με το απόρρητο.
  • Πλατφόρμες όπως το Meta, το Reddit, το Tumblr και το WordPress.com συμμετέχουν ενεργά σε αυτές τις συμφωνίες αδειοδότησης δεδομένων για εκπαίδευση τεχνητής νοημοσύνης.
  • Οι χρήστες μπορούν να κάνουν μερικά μικρά βήματα για να προστατεύσουν τα δεδομένα τους, όπως να προσαρμόσουν τις ρυθμίσεις απορρήτου, να εξαιρεθούν από την κοινή χρήση και να είναι προσεκτικοί σε ό,τι δημοσιεύουν στο διαδίκτυο.

Ένας από τους νεότερους τρόπους με τους οποίους οι εταιρείες μέσων κοινωνικής δικτύωσης δημιουργούν έσοδα από δεδομένα χρηστών είναι μέσω συμφωνιών με εταιρείες τεχνητής νοημοσύνης. Υπάρχει όμως κάτι που μπορούν να κάνουν οι απλοί χρήστες για να προστατεύσουν τα δεδομένα και το περιεχόμενό τους;

Η χρήση δεδομένων μέσων κοινωνικής δικτύωσης για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης ήταν μια αμφιλεγόμενη κίνηση — αλλά αυτό δεν φαίνεται να εμποδίζει τις εταιρείες κοινωνικών μέσων να διανέμουν δεδομένα χρηστών.

Η Meta χρησιμοποιεί ήδη δεδομένα μέσων κοινωνικής δικτύωσης για να εκπαιδεύσει τις δυνατότητες δημιουργίας AI που ανακοινώθηκαν στο Meta Connect το 2023. Αυτό περιλαμβάνει το Meta AI και λειτουργίες όπως η δημιουργία αυτοκόλλητων που δημιουργούνται από AI στο WhatsApp.

Όπως δήλωσε ο Mike Clark, Διευθυντής Product Management στη Meta, στο α Ανάρτηση στο Meta Newsroom:

«Οι δημοσίως κοινοποιημένες αναρτήσεις από το Instagram και το Facebook —συμπεριλαμβανομένων φωτογραφιών και κειμένου— ήταν μέρος των δεδομένων που χρησιμοποιήθηκαν για την εκπαίδευση των μοντέλων τεχνητής νοημοσύνης που δημιουργούνται κάτω από τις δυνατότητες που ανακοινώσαμε στο Connect».

  14 Εργαλεία ενορχήστρωσης κοντέινερ για DevOps

Αυτή η τάση δεν φαίνεται να επιβραδύνεται το 2024. Σύμφωνα με Reutersτο Reddit κατέληξε σε συμφωνία με την Google για να διαθέσει το περιεχόμενο της πλατφόρμας κοινωνικών μέσων για εκπαίδευση μοντέλων τεχνητής νοημοσύνης.

Η κατάθεση S-1 του Reddit για την IPO της, που κατατέθηκε στις 22 Φεβρουαρίου 2024, επιβεβαιώνει ότι η εταιρεία διερευνά συμφωνίες αδειοδότησης. Η κατάθεση αναφέρει:

«Τα δεδομένα του Reddit είναι ένα θεμελιώδες κομμάτι για την κατασκευή της τρέχουσας τεχνολογίας AI και πολλών LLM. Πιστεύουμε ότι το τεράστιο σύνολο δεδομένων και γνώσεων συνομιλίας του Reddit θα συνεχίσει να παίζει ρόλο στην εκπαίδευση και τη βελτίωση των LLMs.”

Διευκρινίζει ότι το Reddit βρίσκεται «στα πρώτα στάδια της παροχής άδειας σε τρίτα μέρη για την πρόσβαση στην αναζήτηση, ανάλυση και εμφάνιση ιστορικών δεδομένων και δεδομένων σε πραγματικό χρόνο από την πλατφόρμα μας», προκειμένου να εκπαιδεύσει τους LLM.

Και ενώ το Meta και το Reddit είναι μερικά από τα μεγαλύτερα ονόματα στα μέσα κοινωνικής δικτύωσης, δεν είναι οι μόνες πλατφόρμες που εμπλέκονται στη χρήση δεδομένων κοινωνικών μέσων για την εκπαίδευση της τεχνητής νοημοσύνης. Σύμφωνα με α ρεπορτάζ του 404 MediaTumblr και WordPress.com ετοιμάζονται να πουλήσουν δεδομένα χρηστών στο Midjourney και στο OpenAI.

Οι πιθανότητες είναι ότι εάν χρησιμοποιείτε Facebook, Instagram, Reddit, Tumblr ή WordPress.com, το δημόσια διαθέσιμο περιεχόμενό σας έχει ήδη χρησιμοποιηθεί στην εκπαίδευση των LLM.

Για παράδειγμα, εάν χρησιμοποιείτε το Το εργαλείο αναζήτησης της Washington Post για να δείτε ποιοι ιστότοποι συμπεριλήφθηκαν στο σύνολο δεδομένων C4 της Google, το οποίο χρησιμοποιήθηκε ως μέρος της εκπαίδευσης του Bard, θα δείτε ότι το Reddit.com αντιπροσωπεύει 7,9 εκατομμύρια διακριτικά.

  Πώς να αποκτήσετε το Stock Gnome Shell στο Ubuntu 17.10

Το Tumblr.com αντιπροσωπεύει 1,6 εκατομμύρια μάρκες. Ο δικός μου μικρός ιστότοπος, ο οποίος χρησιμοποιεί το WordPress.com, αντιπροσώπευε 14.000 διακριτικά—άρα μικρά προσωπικά ιστολόγια μπορεί να έχουν συμπεριληφθεί στο σύνολο δεδομένων.

Με τις συνεχιζόμενες συμφωνίες μεταξύ εταιρειών τεχνητής νοημοσύνης και εταιρειών μέσων κοινωνικής δικτύωσης, οι συμφωνίες αδειοδότησης θα σημαίνουν ότι αυτά τα δεδομένα θα πωλούνται ενεργά και όχι απλώς θα αφαιρούνται από τον Ιστό.

Αλλά όταν πρόκειται για μελλοντική επεξεργασία, τι μπορείτε να κάνετε για αυτό; Ο Meta εισήγαγε α έντυπο για τα δικαιώματα υποκειμένου δεδομένων τεχνητής νοημοσύνης που σας επιτρέπει να αντιταχθείτε ή να περιορίσετε την επεξεργασία των προσωπικών σας δεδομένων από τρίτα μέρη για την εκπαίδευση των μοντέλων τεχνητής νοημοσύνης της Meta.

Συγκεκριμένα, αυτή η επιλογή δεν σας επιτρέπει να αντιταχθείτε στην επεξεργασία των δεδομένων σας από πρώτο μέρος της ίδιας της Meta για εκπαίδευση γενετικής τεχνητής νοημοσύνης. Επιπλέον, όταν υπέβαλα ένα δελτίο για να αντιταχθώ στη χρήση των προσωπικών μου δεδομένων χρησιμοποιώντας τη φόρμα, το δελτίο υποστήριξης απαιτούσε να αποδείξω ότι τα προσωπικά μου στοιχεία εμφανίζονταν ήδη στα αποτελέσματα δημιουργίας τεχνητής νοημοσύνης της Meta.

Το Tumblr έχει επίσης εισαγάγει μια επιλογή εξαίρεσης από την κοινή χρήση του περιεχομένου των δημόσιων ιστολογίων σας με τρίτα μέρη που χρησιμοποιούν τις ρυθμίσεις του ιστολογίου σας. Μπορείτε να το βρείτε στις ρυθμίσεις σας κάνοντας κλικ στο ιστολόγιό σας και κάνοντας κύλιση προς τα κάτω στις ρυθμίσεις ορατότητας. Στη συνέχεια, επιλέξτε Αποτροπή κοινής χρήσης τρίτων για το ιστολόγιό σας.

Όταν πρόκειται για μια πλατφόρμα όπως το Instagram, θα μπορούσατε να προσπαθήσετε να αλλάξετε τον λογαριασμό σας Instagram σε ιδιωτικό για να αποτρέψετε τη χρήση των δεδομένων σας. Αυτό δεν εγγυάται ότι τα δεδομένα σας δεν θα χρησιμοποιηθούν, αλλά δεδομένου ότι η απόξεση δεδομένων για LLM φαίνεται να επικεντρώνεται σε δημόσια δεδομένα, θα μπορούσε να είναι μια πιθανή διασφάλιση.

  7 λόγοι για να επιλέξετε το React Native για την ανάπτυξη εφαρμογών για κινητά

Μπορείτε επίσης να κάνετε τον λογαριασμό σας X (Twitter) ιδιωτικό, αλλά και πάλι αυτό είναι απλώς μια πιθανή ασφάλεια και δεν εγγυάται ότι τα δεδομένα σας παραμένουν ιδιωτικά.

ΕΝΑ κοινή δήλωση από διάφορους εθνικούς επιτρόπους πληροφοριών και εμπειρογνώμονες σε όλο τον κόσμο έχει προτείνει επίσης ορισμένες ενέργειες για άτομα που επιθυμούν να ελαχιστοποιήσουν τον κίνδυνο απορρήτου από τη διαγραφή δεδομένων από εταιρείες τεχνητής νοημοσύνης. Η συμβουλή περιλαμβάνει:

  • Διαβάστε τους όρους και την πολιτική απορρήτου ενός ιστότοπου για να δείτε πώς μοιράζεται τα προσωπικά σας στοιχεία.
  • Περιορίστε τις πληροφορίες που δημοσιεύετε στο διαδίκτυο, ιδιαίτερα τις ευαίσθητες πληροφορίες.
  • Διαχειριστείτε τις ρυθμίσεις απορρήτου σας.
  • Σκεφτείτε μακροπρόθεσμα τις πληροφορίες που μοιράζεστε στο διαδίκτυο.
  • Επικοινωνήστε με την εταιρεία μέσων κοινωνικής δικτύωσης ή τον ιστότοπο εάν πιστεύετε ότι τα δεδομένα σας έχουν υποστεί ακατάλληλη απόξεση. Εάν δεν είστε ικανοποιημένοι με την απάντησή τους, υποβάλετε καταγγελία στην αρμόδια αρχή προστασίας δεδομένων σας.

Μπορείτε επίσης να διαγράψετε ορισμένες πληροφορίες στο διαδίκτυο, εάν δεν αισθάνεστε άνετα με την πρόσβαση τρίτων μερών σε αυτές, αν και οι δημοσίως διαθέσιμες πληροφορίες στα προφίλ σας μπορεί να έχουν ήδη αποσυντεθεί.

Δυστυχώς, εμείς ως τακτικοί χρήστες μπορούμε να κάνουμε τόσα πολλά για να προστατεύσουμε τα δεδομένα μας από εταιρείες τεχνητής νοημοσύνης. Ο πραγματικός έλεγχος αυτών των πληροφοριών πιθανότατα θα έρθει μόνο με τη βοήθεια των ρυθμιστικών αρχών.