Πλήρης οδηγός για τον εντοπισμό λογοκλοπής Chatbot AI

Τα AI Chatbots όπως το ChatGPT δεν περιορίζονται στο να απαντούν απλώς στις ερωτήσεις σας. Μπορούν να γράφουν μηνύματα ηλεκτρονικού ταχυδρομείου παρόμοια με τον άνθρωπο, συνοδευτικές επιστολές, δοκίμια, ποίηση, αναρτήσεις ιστολογίου και πολλά άλλα.

Η γραφή με τεχνητή νοημοσύνη είναι σαν χαμαιλέοντας – μπορεί να συνδυαστεί με οποιοδήποτε άλλο είδος γραφής τόσο καλά που θα δυσκολευτείτε να διακρίνετε τη διαφορά.

Δυστυχώς, αυτό καθιστά απίστευτα δύσκολο για εμάς τους ανθρώπους να ανιχνεύσουμε πότε ένα AI έχει γράψει κάτι αντί για ένα άτομο. Σίγουρα, όλοι θα μπορούσαμε να λάβουμε τη συμβουλή του Σέρλοκ Χολμς και να «εξαλείψουμε το αδύνατο», αλλά ποιος έχει χρόνο για αυτό;

Κι αν σας πω ότι η παραπάνω παράγραφος είναι γραμμένη από AI; Ναι, ζήτησα από το YouWrite να γράψει μια γρήγορη εισαγωγή για αυτήν την ανάρτηση, κάτι που κατέληξε. Αρκετά πειστικό σωστά; Αυτό είναι το πρόβλημα, είναι πολύ πειστικό ότι ο καθένας μπορεί να το παρουσιάσει ως δικό του έργο για να επωφεληθεί από αυτό.

Τα AI δεν αναδιατυπώνουν απλώς το περιεχόμενο. μαθαίνουν το θέμα και το παρουσιάζουν σε φυσική γλώσσα χρησιμοποιώντας RLHF. Αυτό σημαίνει ότι το περιεχόμενο που δημιουργείται δεν θα είναι ούτε ρομποτικό για ανάγνωση ούτε μπορεί να συγκριθεί με δεδομένα που είναι διαθέσιμα στο διαδίκτυο για να διαπιστωθεί λογοκλοπή.

Η σύλληψη περιεχομένου που δημιουργείται από την τεχνητή νοημοσύνη δεν είναι εύκολη και δεν πρόκειται να σας δώσω ψεύτικες ελπίδες ότι μπορείτε να το πιάσετε με 100% ακρίβεια. Ωστόσο, με λίγη εργασία ντετέκτιβ και λίγη βοήθεια από τα εργαλεία ανίχνευσης γραφής AI, μπορείτε να πιάσετε τα περισσότερα έργα τεχνητής νοημοσύνης.

Παρακάτω θα βρείτε μη αυτόματους τρόπους ανίχνευσης λογοκλοπής τεχνητής νοημοσύνης καθώς και ορισμένα αυτόματα εργαλεία.

Πίνακας περιεχομένων

Χειροκίνητος εντοπισμός λογοκλοπής AI 🕵️

Το ChatGPT δεν είναι καν μεγάλο πρόβλημα όταν πρόκειται για λογοκλοπή AI. Υπάρχουν πολλά εναλλακτικά εργαλεία που βασίζονται στην ίδια τεχνολογία GPT-3 και είναι κατασκευασμένα για γραφή. Αυτά είναι πολύ προηγμένα και ειδικά φτιαγμένα για να δημιουργούν περιεχόμενο που μοιάζει με άνθρωπο που είναι δύσκολο να πιαστεί.

Τα εργαλεία αυτόματης ανίχνευσης είναι λίγο ή χάνονται ανάλογα με τον τύπο περιεχομένου, το μήκος και την πολυπλοκότητα. Έτσι τουλάχιστον επί του παρόντος, η μη αυτόματη σύνδεση των κουκκίδων για να καταλάβουμε εάν η εγγραφή έχει δημιουργηθεί από AI ή όχι είναι ο καλύτερος τρόπος.

Παρακάτω έχω παραθέσει μερικές κοινές ενδείξεις που θα μπορούσατε να αναζητήσετε για να συλλάβετε περιεχόμενο που δημιουργείται από AI.

#1. Ξεπερασμένες πληροφορίες

Το ChatGPT και άλλα τεχνητή νοημοσύνη που βασίζεται στο GPT-3 περικόπηκαν οι γνώσεις τους στα τέλη του 2021. Παρόλο που ορισμένα ρομπότ τεχνητής νοημοσύνης έχουν ενσωματωμένη μηχανή αναζήτησης για την αναζήτηση των πιο πρόσφατων πληροφοριών, εξακολουθούν να βασίζονται σε παλιά δεδομένα για τη σύνταξη περιεχομένου μεγάλης μορφής όπως δοκίμια ή αναρτήσεις ιστολογίου.

Τι πρέπει να γνωρίζετε για το νέο πρόγραμμα περιήγησης Microsoft Edge

Αν παρατηρήσετε ότι η εγγραφή μιλάει συνεχώς για ξεπερασμένα δεδομένα, συγκεκριμένα πριν από το 2021, τότε θα μπορούσε να έχει δημιουργηθεί από AI.

Στο παρακάτω στιγμιότυπο οθόνης, ζήτησα από το YouWrite να μου πει για το πρόσφατο Παγκόσμιο Κύπελλο FIFA, και αυτό κατέληξε.

Μιλάει για το Παγκόσμιο Κύπελλο 2018 αντί για το πρόσφατο του 2022. Παρόλο που το εργαλείο είναι ενημερωμένο για να μιλήσει για πρόσφατα γεγονότα όπως το Παγκόσμιο Κύπελλο του 2022, για τη σύνταξη μεγάλων αναρτήσεων, εξακολουθεί να χρησιμοποιεί τα ξεπερασμένα δεδομένα στα οποία βασίζεται.

#2. Χρησιμοποιεί την ίδια δομή προτάσεων για περιγραφές

Κατά τη σύνταξη περιγραφών πολλών προϊόντων/εφαρμογών, η τεχνητή νοημοσύνη χρησιμοποιεί συνήθως την ίδια δομή προτάσεων που επεξεργάζεται για να ταιριάζει στην περιγραφή ενός προϊόντος. Οι περιγραφές συνήθως ξεκινούν με την ίδια λέξη, όπως The, It, A ή το όνομα του προϊόντος. Οι περιγραφές έχουν επίσης μια ειδική εστίαση που επαναλαμβάνει.

Για παράδειγμα, παρακάτω, ζήτησα από το ChatGPT να μου πει για “ιστοτόπους εργασιών εισαγωγής δεδομένων”. Μπορείτε να δείτε όλες τις περιγραφές να ξεκινούν με “Α” και να έχουν αυστηρή εστίαση.

Έκανα επίσης την ίδια ερώτηση στο YouChat και έκανε το ίδιο πράγμα και επανέλαβε το όνομα κάθε ιστότοπου στην αρχή και οι ίδιες οι περιγραφές μοιάζουν με μια αναδιατυπωμένη έκδοση του καθενός.

Εάν η εγγραφή που αναλύετε έχει μια περιγραφή οτιδήποτε παρόμοιου χαρακτήρα, είναι ένας πολύ καλός τρόπος για να συλλάβετε τη γραφή με τεχνητή νοημοσύνη.

#3. Χρησιμοποιεί σύντομες προτάσεις

Για τις περισσότερες εγγραφές, η τεχνητή νοημοσύνη θα χρησιμοποιεί προτάσεις μιας γραμμής με ένα μόνο κόμμα το πολύ. Ίσως προσπαθούν να ελαχιστοποιήσουν την πιθανότητα λάθους, αλλά αποφεύγουν να γράφουν μεγάλες προτάσεις που μπορεί να απαιτούν τη χρήση άνω τελείων, ερωτηματικών ή βαριών οριζόντιων γραμμών.

Γνωρίζω ότι αυτό δεν είναι η καλύτερη ένδειξη για να πιάσετε τη γραφή τεχνητής νοημοσύνης, αλλά αξίζει να το σκεφτείτε για να αποδείξετε περαιτέρω την υποψία σας.

#4. Μπορεί να παρέχει λανθασμένες πληροφορίες

Για περίπλοκες ερωτήσεις που συνήθως περιλαμβάνουν κάποιου είδους οδηγίες, το AI μπορεί να μην κατανοήσει την πρόθεση και να παρέχει εσφαλμένες πληροφορίες. Δεν μιλάω για ξεπερασμένες πληροφορίες εδώ, απλά σας λένε με σιγουριά τις λάθος πληροφορίες όταν δεν καταλαβαίνουν το θέμα.

Για παράδειγμα, ζήτησα από το YouWrite να μου πει “πώς να κάνω root ένα τηλέφωνο Android χωρίς υπολογιστή”. Μου έδειχνε ακόμα μεθόδους που περιλαμβάνουν τη χρήση υπολογιστή σε κάποιο σημείο της διδασκαλίας.

#5. Δεν προσθέτει προσωπική άποψη

Όταν μιλάμε για κάτι, το AI απλώς μιλά για γνωστά γεγονότα. Σε αντίθεση με τους ανθρώπους, δεν θα μιλήσει για την προσωπική του εμπειρία με αυτό. Αν και οι AI μπορούν να λάβουν οδηγίες για τη δημιουργία μιας πρακτικής εγγραφής, τείνουν να αποφεύγουν να το κάνουν από προεπιλογή.

Αξιόπιστη πλατφόρμα για μικρές και μεγάλες επιχειρήσεις

Αν παρατηρήσετε ότι η εγγραφή μιλάει μόνο για γνωστά γεγονότα, είναι πολύ πιθανό να έχει γραφτεί από AI. Για παράδειγμα, ενώ μιλάμε για μια εφαρμογή, θα μιλήσει για τις δυνατότητές της αντί για το πόσο ομαλή είναι η πλοήγηση ή πώς πραγματικά να χρησιμοποιήσετε την εφαρμογή.

#6. Σύντομες Επεξηγήσεις

Καθώς τα AI περιορίζονται από τη γνώση που είναι διαθέσιμη αυτή τη στιγμή, τείνουν να γράφουν σύντομες επεξηγήσεις και περιγραφές. Από την εμπειρία μου, αν μιλούν για ένα συγκεκριμένο θέμα – όπως το rooting Android – κρατούν την εξήγηση εντός 2-3 παραγράφων το πολύ. Και για πράγματα όπως εφαρμογές ή προϊόντα, η περιγραφή συνήθως δεν υπερβαίνει τη 1 παράγραφο.

Οι άνθρωποι μπορούν να γράψουν σε βάθος για κάτι, συμπεριλαμβανομένων των χαρακτηριστικών, των περιορισμών, της προσωπικής εμπειρίας, των τιμών κ.λπ. Από την άλλη πλευρά, η τεχνητή νοημοσύνη συνήθως εστιάζει στα κύρια χαρακτηριστικά ή τα κυριότερα σημεία, επομένως η εγγραφή είναι επίσης σύντομη. Εάν ο εκπαιδευτής ζητήσει περισσότερες λεπτομέρειες, η πιθανότητα λανθασμένων πληροφοριών αυξάνεται σημαντικά.

#7. Ελέγξτε το ιστορικό του συγγραφέα

Ως δάσκαλος ή webmaster, εάν έχετε πρόσβαση στην προηγούμενη εργασία ή τις εργασίες του συγγραφέα, ίσως είναι καλή ιδέα να το συγκρίνετε με το κείμενο για το οποίο είστε ύποπτοι. Είναι πολύ απίθανο ο συγγραφέας να έχει παρόμοιο στυλ γραφής με ένα AI. Παρόλο που η τεχνητή νοημοσύνη μπορεί να αλλάξει τους τόνους γραφής, αλλά τα στυλ που επιλέγει είναι μάλλον γενικά και δεν μπορεί να αντιγράψει τον τόνο σας.

Λαμβάνοντας το παράδειγμα της παραγράφου που δημιουργήθηκε από AI στην εισαγωγή αυτής της ανάρτησης. Όποιος έχει διαβάσει τις προηγούμενες αναρτήσεις μου μπορεί εύκολα να δει ότι το στυλ γραφής μου είναι εντελώς διαφορετικό σε σύγκριση με αυτό.

Μπορείτε απλώς να διαβάσετε 2-3 προηγούμενα έργα του συγγραφέα και να δείτε αν ταιριάζει με το στυλ γραφής της ύποπτης γραφής.

Εργαλεία για τον εντοπισμό λογοκλοπής AI

Υπάρχει ένα σωρό διαθέσιμα εργαλεία που μπορούν να ανιχνεύσουν περιεχόμενο γραμμένο με AI. Ωστόσο, η ακρίβειά τους είναι διαφορετική μεταξύ τους και μπορεί να αποτύχει ανάλογα με τον τύπο του περιεχομένου και τη διάρκεια.

Δοκίμασα αυτά τα εργαλεία χρησιμοποιώντας διαφορετικούς τύπους περιεχομένου που δημιουργούνται από τα ChatGPT, GPT-3 Playground, WriteSonic, Rytr και YouWrite. Κατάφεραν να εντοπίσουν όλους τους τύπους περιεχομένου που παράγεται από το ChatGPT και το GPT-3 Playground.

Παρόλο που είχαν μικτά αποτελέσματα για ειδικά εργαλεία γραφής, είναι ενδιαφέρον ότι όλα απέτυχαν να ανιχνεύσουν το YouWrite, υποθέτω ότι αυτό οφείλεται στο ότι το YouWrite κάνει λάθη που μοιάζουν με ανθρώπους με σκοπό να αποφύγει τον εντοπισμό.

Θα σας προτείνω να χρησιμοποιήσετε αυτά τα εργαλεία παράλληλα με τον μη αυτόματο έλεγχο του περιεχομένου. Πρώτα, αναλύστε το περιεχόμενο με ένα από αυτά τα εργαλεία και, στη συνέχεια, ελέγξτε χειροκίνητα για τυχόν ενδείξεις για να επιβεβαιώσετε περαιτέρω την υποψία.

Παρακάτω παραθέτω αυτά που πρόσφεραν τα καλύτερα αποτελέσματα και είναι τα πιο εύχρηστα:

Τι είναι ο Whiteboard της Microsoft και πώς τον χρησιμοποιείτε;

Σημείωση: Για επίδειξη, πρόκειται να χρησιμοποιήσω κείμενο που δημιουργήθηκε από τη WriteSonic σχετικά με τα “Πλεονεκτήματα των Mangoes”.

#1. Περιεχόμενο σε κλίμακα

Βρήκα ότι ο ανιχνευτής περιεχομένου AI από το Content At Scale είναι ο πιο ακριβής για τις περισσότερες δοκιμές που έτρεξα. Σας επιτρέπει να σαρώσετε έως και 2500 χαρακτήρες ανά σάρωση και κάνει μια ποσοστιαία πρόβλεψη που δείχνει πραγματική ή ψεύτικη πυκνότητα περιεχομένου.

Περιεχόμενο που είναι πάνω από 60% ψεύτικο είναι ασφαλές να υποθέσουμε ότι είναι γραμμένο από περιεχόμενο τεχνητής νοημοσύνης, τουλάχιστον το μεγαλύτερο μέρος του. Στο παρακάτω στιγμιότυπο οθόνης, μπορείτε να δείτε ότι το περιεχόμενο του 96% είναι ψεύτικο, το οποίο δημιούργησα πλήρως με AI.

#2. GPTZero

Αν θέλετε να δείτε ακριβώς ποιο περιεχόμενο δημιουργείται με τεχνητή νοημοσύνη, τότε το GPTZero είναι μια καλή επιλογή. Το GPTZero δεν βαθμολογεί περιεχόμενο. Αντίθετα, επισημαίνει το ακριβές περιεχόμενο που πιθανώς δημιουργείται από την τεχνητή νοημοσύνη.

Αν και εμφανίζει βαθμολογίες αμηχανίας και ριπής για να πάρετε μια ιδέα της τυχαιότητας στο κείμενο, το πιο σημαντικό είναι ότι υποστηρίζει 5000 χαρακτήρες ανά σάρωση και μπορεί επίσης να ανεβάσει αρχεία. Η σάρωση μεγάλου περιεχομένου βοηθά σημαντικά στη βελτίωση της ακρίβειας.

#3. Ανιχνευτής εξόδου GPT-2

Οι δημιουργοί του ChatGPT προσφέρουν επίσης ένα bot για τον εντοπισμό της δικής τους δουλειάς. Καθώς το GPT-2 και το GPT-3 διαφέρουν μόνο στα συνολικά δεδομένα που χρησιμοποιούνται για εκπαίδευση, αυτός ο ανιχνευτής GPT-2 λειτουργεί καλά και για AI που βασίζονται στο GPT-3.

Δεν υπάρχει όριο στο πόσο περιεχόμενο μπορεί να σαρώσει, επομένως είναι ιδανικό για τον εντοπισμό πολύ μεγάλου περιεχομένου που δημιουργείται από AI. Βρήκα επίσης την ακρίβειά του μια χαρά, ειδικά για περιεχόμενο που δημιουργείται από το ChatGPT. Ωστόσο, είναι λίγο χαμένο στις προβλέψεις, επομένως λάβετε υπόψη τα αποτελέσματά του μόνο όταν εμφανίζει πάνω από το 50% του περιεχομένου ως ψεύτικο.

#4. Writer AI Content Detector

Τα αποτελέσματα του Writer Content Detector είναι αμφισβητήσιμα κατά τον εντοπισμό περιεχομένου από εργαλεία γραφής AI, αλλά λειτουργεί εξαιρετικά για περιεχόμενο που δημιουργείται από το ChatGPT. Μπορείτε να σαρώσετε 1500 χαρακτήρες ανά σάρωση και ακόμη και να προσθέσετε τη διεύθυνση URL του περιεχομένου εάν έχει ήδη δημοσιευτεί.

Για το δοκιμαστικό μου κείμενο που δημιουργήθηκε από την τεχνητή νοημοσύνη, είπε ότι το 94% του περιεχομένου είναι δημιουργημένο από τον άνθρωπο, κάτι που είναι αρκετά χαμηλό σε σύγκριση με άλλα εργαλεία. Ωστόσο, αξίζει να το χρησιμοποιήσετε για τον εντοπισμό περιεχομένου ChatGPT, ειδικά αν έχει ήδη δημοσιευτεί.

#5. Σχέδιο & Γκολ

Ένα απλό αλλά ισχυρό εργαλείο ανίχνευσης γραφής AI. Από την εμπειρία μου, το Draft & Goal πρόσφερε παρόμοια αποτελέσματα με το περιεχόμενο σε κλίμακα, αλλά δεν έχει όριο πλήθους λέξεων, ώστε να μπορείτε να σαρώνετε μεγάλες εγγραφές. Ωστόσο, ο χρόνος σάρωσης αυξάνεται ανάλογα με το πόσο περιεχόμενο σαρώνετε.

Για το παράδειγμα κειμένου μου, λέει ότι το 94% του κειμένου είναι δημιουργημένο από AI.

Οι σκέψεις μου 💭

Προσωπικά πιστεύω ότι η βοήθεια AI είναι στην πραγματικότητα ένας πολύ καλός τρόπος για να αφαιρέσετε το μπλοκ του συγγραφέα, να λάβετε όλες τις πληροφορίες σε ένα μέρος και να βρείτε έμπνευση. Ωστόσο, δεν πρέπει ποτέ να αντικαταστήσει την ανθρώπινη γραφή, καθώς η τεχνητή νοημοσύνη περιορίζεται στη γνώση που είναι ήδη γνωστή.

Μπορείτε επίσης να εξερευνήσετε μερικά καλύτερα εργαλεία ελέγχου λογοκλοπής για να αποτρέψετε την αντιγραφή.