Τι είναι το Claude 3 και τι μπορείτε να κάνετε με αυτό;

Γρήγοροι Σύνδεσμοι

Βασικά Takeaways

  • Το Claude 3 από το Anthropic προσφέρει ένα σημαντικό άλμα από το Claude 2 και ξεπερνά το GPT-4 σε διάφορες εργασίες.
  • Με το Claude 3, μπορείτε να δημιουργήσετε απαντήσεις για μια σειρά ερωτημάτων σε διαφορετικά πεδία, όλα χωρίς χρέωση συνδρομής.
  • Ο Claude 3 ανταγωνίζεται καλά το GPT-4 του ChatGPT, διαπρέπει σε τομείς όπως οι εργασίες προγραμματισμού, η δημιουργική γραφή και το μέγεθος παραθύρου περιβάλλοντος.

Η Anthropic ανακοίνωσε την κυκλοφορία του Claude 3 — μιας οικογένειας μοντέλων τεχνητής νοημοσύνης με τη δυνατότητα να αναστατώσει το GPT-4. Έχει εξαιρετικές δυνατότητες, αλλά είναι έτοιμο να πάρει το στέμμα του ChatGPT;

Τι είναι ο Claude 3;

Το Claude 3 είναι μια οικογένεια τριών πολυτροπικών μοντέλων AI που αναπτύχθηκε από την Anthropic για να αντικαταστήσει τη σειρά μοντέλων AI Claude 2. Θα μπορούσατε να πείτε ότι το Claude 3 είναι η απάντηση της Anthropic στο Gemini της Google και στο GPT-4 του OpenAI. Κυκλοφόρησε σε τρεις εκδόσεις, Haiku, Sonnet και Opus, με την αυξανόμενη σειρά ευφυΐας τους, το Claude 3 είναι το πρώτο πολυτροπικό μοντέλο AI της Anthropic και αντιπροσωπεύει ένα σημαντικό άλμα από τη σειρά Claude 2.

Τώρα, αν δεν έχετε ακούσει ποτέ για το chatbot Claude AI, είναι κατανοητό. Ο Claude και τα υποκείμενα μοντέλα του δεν απολαμβάνουν το καθεστώς σούπερ σταρ του ChatGPT ή την απήχηση της επωνυμίας του Gemini της Google. Ωστόσο, ο Claude είναι αναμφίβολα ένα από τα πιο προηγμένα chatbot AI στον κόσμο, ξεπερνώντας τις επιδόσεις του πολυδιαφημισμένου ChatGPT σε πολλούς βασικούς τομείς.

Για να εκτιμήσετε πραγματικά το Claude 3, είναι σημαντικό να ανατρέξετε στις αποτυχίες των προηγούμενων μοντέλων.

  • Οι προηγούμενες επαναλήψεις του Claude είχαν τη φήμη για μια υπερβολική προσέγγιση στην ασφάλεια της τεχνητής νοημοσύνης. Τα χαρακτηριστικά ασφαλείας Claude 2, για παράδειγμα, ήταν τόσο σφιχτά που το chatbot θα απέφευγε πάρα πολλά θέματα, ακόμη και εκείνα που δεν είχαν σαφή προβλήματα ασφάλειας.
  • Υπήρχαν επίσης προβλήματα με το παράθυρο περιβάλλοντος του μοντέλου. Όταν ζητάτε από ένα μοντέλο τεχνητής νοημοσύνης να εξηγήσει κάτι ή, ας πούμε, συνοψίζει ένα μεγάλο άρθρο, φανταστείτε ότι μπορεί να διαβάσει μόνο μερικές παραγράφους του άρθρου κάθε φορά. Αυτό το όριο του πόσο κείμενο μπορεί να λάβει υπόψη κάθε φορά ονομάζεται “παράθυρο περιβάλλοντος”. Οι προηγούμενες εκδόσεις του Claude είχαν ένα παράθυρο περιβάλλοντος 200 χιλιάδων (που ισοδυναμεί με 150.000 λέξεις). Ωστόσο, το μοντέλο δεν ήταν σε θέση να αντιμετωπίσει πρακτικά τόσο πολύ κείμενο χωρίς να ξεχάσει κάποια κομμάτια του.
  • Υπήρχε επίσης το θέμα της πολυτροπικότητας. Σχεδόν κάθε σημαντικό μοντέλο τεχνητής νοημοσύνης έχει γίνει πολυτροπικό, πράγμα που σημαίνει ότι μπορούν να επεξεργάζονται άλλες μορφές δεδομένων, όπως εικόνες, και να ανταποκρίνονται σε αυτά τα δεδομένα (και όχι απλώς την εισαγωγή κειμένου). Ο Κλοντ δεν μπορούσε να το κάνει.
  •   13 καλύτερες πλατφόρμες και ανταλλαγές κρυπτονομισμάτων το 2022

    Και τα τρία ζητήματα έχουν πλέον αντιμετωπιστεί πλήρως ή τουλάχιστον εν μέρει με την κυκλοφορία του Claude 3.

    Τι μπορείτε να κάνετε με τον Claude 3;

    Ακριβώς όπως τα περισσότερα πρωτοποριακά μοντέλα τεχνητής νοημοσύνης εκεί έξω, το Claude 3 μπορεί να δημιουργήσει κορυφαίες απαντήσεις για διάφορα ερωτήματα σε διαφορετικά πεδία. Είτε χρειάζεστε μια γρήγορη επίλυση του προβλήματος της άλγεβρας, ένα ολοκαίνουργιο τραγούδι που γράφτηκε, ένα σε βάθος άρθρο, γραμμένο κώδικα για λογισμικό ή ένα τεράστιο σύνολο δεδομένων να αναλυθεί, το Claude 3 ταιριάζει.

    Αλλά τα περισσότερα μοντέλα AI είναι ήδη καλά σε αυτές τις εργασίες, οπότε γιατί να χρησιμοποιήσετε το Claude 3;

    Η απάντηση είναι απλή. Το Claude 3 δεν είναι απλώς ένα άλλο μοντέλο τεχνητής νοημοσύνης που είναι καλό σε αυτές τις εργασίες, είναι το πιο προηγμένο, ελεύθερα διαθέσιμο πολυτροπικό μοντέλο AI που μπορείτε να βρείτε οπουδήποτε στο Διαδίκτυο. Ναι, υπάρχει το Gemini, το πολυδιαφημισμένο, υποτιθέμενο GPT-4-killer της Google που αποδίδει εντυπωσιακά σε δοκιμές αναφοράς. Ωστόσο, η Anthropic ισχυρίζεται ότι ο Claude 3 το ξεπερνά με ένα εντυπωσιακό περιθώριο σε αρκετές εργασίες. Ενώ τα αποτελέσματα αναφοράς είναι κάτι που πρέπει συχνά να λαμβάνουμε με λίγη αλάτι, δοκίμασα και τα δύο μοντέλα τεχνητής νοημοσύνης και η υπεροχή του μοντέλου Claude 3 σε πολλές σημαντικές περιπτώσεις χρήσης ήταν πολύ ξεκάθαρη.

    Έτσι, το Claude 3 σάς επιτρέπει να κάνετε τα περισσότερα πράγματα που μπορείτε να κάνετε με το Gemini και το GPT-4 (μείον τη δημιουργία εικόνων) χωρίς να χρειάζεται να πληρώσετε το τέλος συνδρομής 20 $ για το ChatGPT premium.

    Claude 3 εναντίον ChatGPT

    Ένας γρήγορος τρόπος για να ελέγξετε την απόδοση ενός μοντέλου τεχνητής νοημοσύνης είναι να ελέγξετε πόσο καλά ανταποκρίνεται στα καλύτερα της αγοράς: GPT-4. Φυσικά, δοκίμασα και τα δύο μοντέλα. πόσο καλά ταιριάζει το Anthropic’s Claude 3 απέναντι στο κολοσσιαίο GPT-4;

    Claude εναντίον ChatGPT: Coding Skills

    Ξεκινώντας με μια σειρά εργασιών προγραμματισμού, ο Claude 3 ταίριαξε με την ικανότητα του GPT -4 σε όλες τις βασικές εργασίες προγραμματισμού που παρουσιάστηκαν και μάλιστα ξεπέρασε σε ορισμένες. Ενώ δοκίμασα μόνο τα βασικά, η προηγούμενη έκδοση του Claude ήταν σημαντικά λιγότερο ικανή στις ίδιες εργασίες όταν τη δοκιμάσαμε σε αυτήν τη σύγκριση ChatGPT εναντίον Claude τον Σεπτέμβριο του 2023. Για παράδειγμα, όταν ζητήσαμε από και τα δύο μοντέλα να δημιουργήσουν μια απλή δουλειά εφαρμογή λίστας, ο Claude απέτυχε σε όλες τις περιπτώσεις, ενώ το ChatGPT παρουσίασε αυτό που θα λέγαμε απόδοση πέντε αστέρων εκείνη την εποχή.

      Πώς να διορθώσετε το σφάλμα "Η πιστωτική/χρεωστική κάρτα δεν είναι πλέον έγκυρη" στο PS5

    Με την τελευταία έκδοση, ο Claude 3 παρήγαγε μια εφαρμογή λίστας υποχρεώσεων με καλύτερη απόδοση και στις τρεις περιπτώσεις που δοκιμάσαμε. Εδώ είναι το αποτέλεσμα του GPT-4 όταν σας ζητηθεί να δημιουργήσετε μια εφαρμογή λίστας υποχρεώσεων.

    Και εδώ είναι το αποτέλεσμα του Claude 3 όταν του ζητήθηκε να κάνει το ίδιο.

    Και οι δύο εφαρμογές ήταν λειτουργικές ως ένα βαθμό, αλλά είναι σαφές ότι ο Claude 3 έκανε καλύτερη δουλειά σε αυτό.

    Αφού δοκίμασε πιο περίπλοκες δοκιμές προγραμματισμού, ο Claude ήταν το καλύτερο μοντέλο σε αρκετές περιπτώσεις, ενώ το GPT-4 είχε επίσης τις νίκες του. Αν και δεν μπορώ να πω οριστικά ότι ο Claude 3 είναι καλύτερος στον προγραμματισμό της λογικής, αν υπήρχε ένα τεράστιο χάσμα μεταξύ των δύο μοντέλων, αυτό το χάσμα θα είχε σχεδόν συρρικνωθεί.

    Claude εναντίον ChatGPT: Συλλογισμός κοινής λογικής

    Προχώρησα για να δοκιμάσω και τα δύο μοντέλα με βάση την κοινή λογική. Η εργασία με chatbots AI είναι ένα ενδιαφέρον παράδοξο. Τα chatbot AI μπορούν να χειριστούν πολύπλοκες εργασίες με ευκολία, αλλά συχνά αντιμετωπίζουν βασικά προβλήματα που απαιτούν κοινή λογική ή λογική. Έτσι, δώσαμε και στα δύο μοντέλα μια σειρά από φαινομενικά απλές ερωτήσεις που απαιτούσαν κοινή λογική για να απαντηθούν σωστά.

    Από πέντε τέτοιες ερωτήσεις, και τα δύο μοντέλα απάντησαν λογικά και στις πέντε. Κάναμε και τα δύο chatbot μια τέτοια ερώτηση: Εάν ένα διαστημόπλοιο από τον Άρη χωριστεί στα δύο, με το ένα μέρος να πέφτει στον Ατλαντικό Ωκεανό κοντά στη Βραζιλία και το άλλο στον Ειρηνικό Ωκεανό κοντά στην Ιαπωνία, πού θάβετε τους επιζώντες;

    Το ChatGPT απάντησε σωστά ακόμη και χωρίς GPT-4. Αν αναρωτιέστε τον λόγο για την επιλογή της ερώτησης, λοιπόν, τα chatbots έχουν ιστορικά αποτύχει θλιβερά σε αυτό το είδος της γραμμής ερωτήσεων. Στη συνέχεια ήταν η σειρά του Κλοντ να απαντήσει.

    Η απάντηση του Claude δεν ήταν ακριβώς μια οριστική απάντηση, αλλά ήταν σε θέση να προσδιορίσει τις βασικές πληροφορίες. δεν θάβεις τους επιζώντες. Είναι σημαντικό να σημειωθεί ότι την τελευταία φορά που κάναμε στον Claude 2 την ίδια ερώτηση, δεν μπόρεσε να δει μέσα από την παγίδα της κοινής λογικής.

      Box εναντίον Dropbox – Ποιο είναι καλύτερο;

    Claude εναντίον ChatGPT: Δημιουργική γραφή

    Στον πραγματικό κόσμο, μια από τις πιο δημοφιλείς περιπτώσεις χρήσης για chatbots AI είναι η δημιουργία δημιουργικού κειμένου σε όλες τις μορφές: άρθρα, επιστολές, στίχους τραγουδιών, όπως πείτε. Λοιπόν, δοκίμασα και τα δύο μοντέλα για να προσδιορίσω ποιο δημιουργεί κείμενο με καλύτερο ανθρώπινο ήχο.

    Η ιδέα είναι ότι τα αποτελέσματα δεν πρέπει να είναι απλώς «σωστά» ή δημιουργικά (με ρομποτικό τρόπο) αλλά να ακούγονται σαν να γράφτηκαν από άνθρωπο. Ανέθεσα και στα δύο μοντέλα να συνθέσουν τους στίχους για ένα τραγούδι ραπ για την καλλιέργεια αγγουριών και να γίνουν εκατομμυριούχοι από αυτά. Ποιος γράφει ραπ τραγούδια για τα αγγούρια; Αυτή είναι η ιδέα – κάτι δύσκολο!

    Ακολουθεί η άποψη του ChatGPT:

    Και εδώ είναι η απάντηση του Claude, χρησιμοποιώντας την ίδια προτροπή.

    Μπορεί να είναι υποκειμενικό, αλλά ο Claude φαίνεται να είναι η καλύτερη επιλογή εδώ. Όταν και τα δύο εργαλεία επιφορτίστηκαν με τη σύνταξη τριών άρθρων για διαφορετικά θέματα, ο Claude παρείχε την καλύτερη επιλογή και στις τρεις περιπτώσεις. Παρήγαγε ένα αποτέλεσμα που μοιάζει περισσότερο με τον άνθρωπο και απέφυγε τα μοτίβα που συνήθως συνδέονται με κείμενα που δημιουργούνται από την τεχνητή νοημοσύνη, όπως οι υπερβολές, η χρήση σύνθετων λέξεων και η σποραδική χρήση λέξεων σύνδεσης.

    Claude εναντίον ChatGPT: Ικανότητες αναγνώρισης εικόνας

    Για να δοκιμάσουμε τις ικανότητες αναγνώρισης εικόνων, δώσαμε στο ChatGPT και τον Claude πολλές εικόνες από δημοφιλή ψηλά κτίρια σε όλο τον κόσμο. Το ChatGPT αναγνώρισε σωστά και τα 20, ενώ ο Claude 3 απέτυχε να αναγνωρίσει μερικά, όπως η αρκετά δημοφιλής Marina 101 του Ντουμπάι, ο Παγκόσμιος Πύργος Lotte στη Σεούλ και το κτήριο Merdeka 118 στην Κουάλα Λουμπούρ της Μαλαισίας.

    Σε αντίθεση με το ChatGPT, ο Claude δυσκολεύτηκε να αναγνωρίσει κτίρια μεταξύ άλλων και το ποσοστό αποτυχίας αυξανόταν αν το κτίριο δεν βρισκόταν στις ΗΠΑ ή την Κίνα. Ωστόσο, δεν είχε κανένα πρόβλημα να εντοπίσει συγκεχυμένες εκδόσεις του Πύργου του Άιφελ ή του Empire State Building.

    Το ChatGPT είναι σαφώς καλύτερο σε αυτό, αλλά λαμβάνοντας υπόψη ότι το Claude 3 είναι η πρώτη προσπάθεια της Anthropic να δημιουργήσει ένα μοντέλο πολυτροπικής τεχνητής νοημοσύνης, δεν ήταν μια κακή έξοδος.

    Παρόλο που μοντέλα μεγάλων επωνύμων όπως το Palm 2 της Google και στη συνέχεια το Gemini, διαφημίζονταν πάντα ως πιθανοί δολοφόνοι του GPT-4, υποστηρίζουμε σταθερά ότι το λιγότερο γνωστό Claude AI πιθανότατα θα έχει αυτή την τιμή από την αρχική του κυκλοφορία τον Μάρτιο του 2023. Μετά από μερικούς μήνες και αρκετές επαναλήψεις στη γραμμή, ο Claude 3 μοιάζει ακριβώς με τον δολοφόνο GPT-4 που περιμέναμε να είναι. Εάν είστε βαρύς χρήστης chatbot αλλά δεν έχετε δοκιμάσει το Claude AI chatbot, χάνετε ένα εξαιρετικά επιδραστικό εργαλείο τεχνητής νοημοσύνης που μπορεί να αυξήσει την παραγωγικότητά σας.