Το Gemini AI της Google είναι εδώ, αλλά είναι καλύτερο από το ChatGPT;

Βασικά Takeaways

  • Το μοντέλο AI Gemini της Google έχει τρεις παραλλαγές, Ultra, Pro και Nano, εστιασμένες σε διαφορετικές εργασίες και επίπεδα πολυπλοκότητας.
  • Το Gemini Ultra δείχνει πολλά υποσχόμενα αποτελέσματα σε βασικά σημεία αναφοράς τεχνητής νοημοσύνης, αλλά, από τον Δεκέμβριο του 2023, δεν είναι διαθέσιμο για δημόσια χρήση. Η Google λέει ότι θα είναι διαθέσιμο τον Ιανουάριο του 2024.
  • Το Gemini Pro είναι διαθέσιμο και ενώ αποδίδει αρκετά καλά, προς το παρόν δεν καταφέρνει να εκθρονίσει το GPT-4.

Η Google έχει υποσχεθεί σταθερά ότι το μοντέλο Gemini AI θα ήταν καλύτερο από το GPT-4 του OpenAI, το μοντέλο που τροφοδοτεί το ChatGPT Plus. Τώρα που ξεκίνησε το Google Gemini, μπορούμε επιτέλους να το δοκιμάσουμε και να δούμε πώς συγκρίνεται το Gemini με το GPT-4.

Όταν η Google κυκλοφόρησε το Bard τον Μάρτιο του 2023, υπήρχαν πολλοί λόγοι για να είστε ενθουσιασμένοι. Επιτέλους, το μονοπώλιο ChatGPT του OpenAI θα σπάσει και θα είχαμε έναν άξιο ανταγωνισμό.

Αλλά ο Μπαρντ δεν ήταν ποτέ ο τιτάνας της τεχνητής νοημοσύνης που ήλπιζαν οι άνθρωποι και το GPT-4 παραμένει η κυρίαρχη πλατφόρμα ρομπότ συνομιλίας με τεχνητή νοημοσύνη. Τώρα, το Gemini της Google είναι εδώ—αλλά είναι το πολυαναμενόμενο μοντέλο AI καλύτερο από το ChatGPT;

Τι είναι το μοντέλο Gemini AI της Google;

Το Gemini είναι το πιο ικανό μοντέλο παραγωγής τεχνητής νοημοσύνης της Google, ικανό να κατανοεί και να λειτουργεί σε διαφορετικές μορφές δεδομένων, συμπεριλαμβανομένων κειμένου, ήχου, εικόνας και βίντεο. Είναι η προσπάθεια της Google να δημιουργήσει ένα ενιαίο μοντέλο τεχνητής νοημοσύνης που να σχεδιάζει δυνατότητες από τις πιο ικανές τεχνολογίες τεχνητής νοημοσύνης της. Το Gemini θα είναι διαθέσιμο σε τρεις παραλλαγές:

  Πώς να διορθώσετε το σφάλμα 0x3a98 στο WlanReport
  • Gemini Ultra: Η μεγαλύτερη και πιο ικανή παραλλαγή που έχει σχεδιαστεί για να χειρίζεται εξαιρετικά πολύπλοκες εργασίες.
  • Gemini Pro: Το καλύτερο μοντέλο για την κλιμάκωση και την παροχή υψηλής απόδοσης σε ένα ευρύ φάσμα εργασιών, αλλά λιγότερο ικανό από το Ultra.
  • Gemini Nano: Το πιο αποτελεσματικό μοντέλο που έχει σχεδιαστεί για ανάπτυξη εργασιών στη συσκευή. Για παράδειγμα, οι προγραμματιστές μπορούν να χρησιμοποιήσουν το Gemini Nano για να δημιουργήσουν εφαρμογές για κινητά ή ολοκληρωμένα συστήματα, φέρνοντας ισχυρό AI στον χώρο των κινητών.
  • Στο επίσημο blog της, Η Λέξη-κλειδί, η Google λέει ότι το Gemini Ultra ξεπερνά την τελευταία λέξη της τεχνολογίας σε πολλά σημεία αναφοράς. Η Google ισχυρίζεται ότι το Gemini Ultra ξεπερνά το κορυφαίο στον κλάδο GPT-4 σε πολλά βασικά σημεία αναφοράς.

    Με μια πρωτοφανή βαθμολογία 90,0% στο αυστηρό σημείο αναφοράς MMLU, η Google λέει ότι το Gemini Ultra είναι το πρώτο μοντέλο που ξεπέρασε την απόδοση σε ανθρώπινο επίπεδο σε αυτό το πολύπλευρο τεστ που καλύπτει 57 θέματα.

    Google

    Το Gemini Ultra μπορεί επίσης να κατανοήσει, να εξηγήσει και να δημιουργήσει κώδικα υψηλής ποιότητας σε μερικές από τις πιο δημοφιλείς γλώσσες προγραμματισμού στον κόσμο, συμπεριλαμβανομένων των Go, JavaScript, Python, Java και C++. Στα χαρτιά, όλα αυτά είναι εξαιρετικά αποτελέσματα. Αλλά όλα αυτά είναι σημεία αναφοράς, και τα σημεία αναφοράς δεν λένε πάντα την όλη ιστορία. Λοιπόν, πόσο καλά αποδίδει ο Δίδυμος σε εργασίες του πραγματικού κόσμου;

    Πώς να χρησιμοποιήσετε το Google Gemini AI

    Από τις τρεις παραλλαγές του μοντέλου Gemini AI, μπορείτε να ξεκινήσετε να χρησιμοποιείτε το Gemini Pro αυτή τη στιγμή. Το Gemini Pro είναι προς το παρόν διαθέσιμο στο chatbot Bard της Google. Για να χρησιμοποιήσετε το Gemini Pro με τον Bard, κατευθυνθείτε στο bard.google.com και συνδεθείτε με τον λογαριασμό σας Google.

      Πώς να εκτελέσετε JavaScript σε κώδικα και πρόγραμμα του Visual Studio σαν επαγγελματίας

    Η Google λέει ότι το Gemini Ultra θα κυκλοφορήσει τον Ιανουάριο του 2024, επομένως έπρεπε να αρκεστούμε στη δοκιμή του Gemini Pro έναντι του ChatGPT προς το παρόν.

    Πώς συγκρίνεται το Gemini με τα GPT-3.5 και GPT-4

    Όταν κυκλοφορεί οποιοδήποτε νέο μοντέλο τεχνητής νοημοσύνης, δοκιμάζεται έναντι των μοντέλων τεχνητής νοημοσύνης GPT του OpenAI, τα οποία είναι γενικά αποδεκτά ως το υπερσύγχρονο μοντέλο που θα πρέπει να αντιμετωπιστούν άλλα μοντέλα. Έτσι, χρησιμοποιώντας το Bard και το ChatGPT, δοκιμάσαμε την ικανότητα του Gemini στα μαθηματικά, τη δημιουργική γραφή, τη δημιουργία κώδικα και την ακριβή επεξεργασία των εισροών εικόνων.

    Ξεκινώντας με την πιο εύκολη μαθηματική ερώτηση που μπορούσαμε να σκεφτούμε, ζητήσαμε από τα δύο chatbot να λύσουν: -1 x -1 x -1.

    Ο Μπαρντ πήγε πρώτος. Επαναλάβαμε την ερώτηση δύο φορές, όλες επιστρέφοντας με λάθος απαντήσεις. Πήραμε την απάντηση στην τρίτη προσπάθεια, αλλά αυτό δεν μετράει.

    Δοκιμάσαμε το ChatGPT να τρέχει σε GPT-3.5. Η πρώτη δοκιμή τα κατάφερε.

    Για να δοκιμάσουμε τις ικανότητες ερμηνείας εικόνας του Gemini, του αναθέσαμε να ερμηνεύσει μερικά δημοφιλή μιμίδια. Αρνήθηκε, λέγοντας ότι δεν μπορεί να ερμηνεύσει εικόνες με άτομα σε αυτό. Το ChatGPT, που εκτελούσε το GPT-4V, ήταν πρόθυμο και ικανό να το κάνει άψογα.

    Δοκιμάσαμε άλλη μια προσπάθεια να το κάνουμε να ερμηνεύσει μια εικόνα ενώ δοκιμάζουμε την ικανότητά του να επιλύει προβλήματα και να κωδικοποιεί. Δώσαμε στον Bard, που εκτελεί το Gemini Pro, ένα στιγμιότυπο οθόνης και του ζητήσαμε να ερμηνεύσει και να γράψει κώδικα HTML και CSS για να αναπαραγάγει το στιγμιότυπο οθόνης.

      Πώς να διαγράψετε επαφές στο iPhone

    Εδώ είναι το στιγμιότυπο οθόνης της πηγής.

    Παρακάτω είναι η προσπάθεια του Gemini Pro να ερμηνεύσει και να αναπαραγάγει το στιγμιότυπο οθόνης χρησιμοποιώντας HTML και CSS.

    Και εδώ είναι η προσπάθεια του GPT-4 να αναπαραγάγει το στιγμιότυπο οθόνης. Το αποτέλεσμα δεν προκαλεί έκπληξη, δεδομένου ότι το GPT-4 ήταν ιστορικά ισχυρό στην κωδικοποίηση. Έχουμε αποδείξει στο παρελθόν ότι χρησιμοποιούμε το GPT-4 για τη δημιουργία μιας εφαρμογής Ιστού από την αρχή.

    Ζητήσαμε από το Gemini Pro να δημιουργήσει ένα ποίημα για την Tesla (τη μάρκα ηλεκτρικών αυτοκινήτων). Έδειξε οριακές βελτιώσεις από προηγούμενες δοκιμές που κάναμε στο παρελθόν. Ιδού το αποτέλεσμα:

    Σε αυτό το σημείο, θεωρήσαμε ότι η σύγκριση των αποτελεσμάτων με το GPT-3.5 αντί του υπερτροφοδοτούμενου GPT-4 θα ήταν πιο κατάλληλη. Έτσι, ζητήσαμε από το ChatGPT με GPT-3.5 να δημιουργήσει ένα παρόμοιο ποίημα.

    Μπορεί να είναι μια προσωπική επιλογή, αλλά η άποψη του Gemini Pro σε αυτό φαίνεται καλύτερη. Αλλά θα σας αφήσουμε να είστε ο κριτής.

    Είναι το Gemini καλύτερο από το ChatGPT;

    Πριν κυκλοφορήσει η Google το Bard, πιστεύαμε ότι θα ήταν ο διαγωνισμός ChatGPT που περιμέναμε — δεν ήταν. Τώρα, ο Gemini είναι εδώ, και μέχρι στιγμής, το Gemini Pro δεν φαίνεται να είναι το μοντέλο που θα δώσει στο ChatGPT το νοκ άουτ.

    Η Google λέει ότι το Gemini Ultra θα είναι πολύ καλύτερο. Ελπίζουμε πραγματικά να είναι και ότι ανταποκρίνεται ή υπερβαίνει τους ισχυρισμούς που αναφέρονται στην ανακοίνωση του Gemini Ultra. Ωστόσο, μέχρι να δούμε και να δοκιμάσουμε την καλύτερη έκδοση του εργαλείου δημιουργίας τεχνητής νοημοσύνης της Google, δεν θα ξέρουμε αν μπορεί να ξεπεράσει άλλους ανταγωνιστές μοντέλων τεχνητής νοημοσύνης. Ως έχει, το GPT-4 παραμένει ο αδιαμφισβήτητος πρωταθλητής μοντέλων AI.