8 Αυτο-φιλοξενούμενη ισχυρή αναζήτηση 🔍 Λογισμικό μηχανών για το προϊόν σας

Φαίνεται τρομακτικό, αλλά η προσθήκη μιας ισχυρής λειτουργίας αναζήτησης στην εφαρμογή σας δεν είναι ούτε περίπλοκη ούτε χρονοβόρα. Εδώ είναι μερικές σταθερές συστάσεις!

Ενώ πολλές τεχνολογίες έχουν εντυπωσιάσει τις τελευταίες 2-3 δεκαετίες, η αναζήτηση είναι από τις ελάχιστες που έχουν γίνει αναπόσπαστο κομμάτι της ζωής μας. Είναι παντού — ιστότοποι ηλεκτρονικού εμπορίου, ιστολόγια, βάσεις γνώσεων και πολλά άλλα — όχι επειδή ένα πλαίσιο αναζήτησης και ένα εικονίδιο φαίνονται όμορφα, αλλά επειδή κάνει κάτι που χρειάζεται απεγνωσμένα.

Αν είστε επιχείρηση που αναζητά μια καλή λύση Αναζήτησης ή έχετε βαρεθεί την υπάρχουσα λύση, τι κάνετε;

Ευτυχώς, δεν χρειάζεται να πληρώνετε αστεία τέλη αδειοδότησης, ούτε χρειάζεται να διατηρείτε μια ομάδα 20 προγραμματιστών και sysadmin. Σήμερα έχω μερικές προτάσεις μηχανών αναζήτησης που μπορούν να εγκατασταθούν και να ενσωματωθούν σε χρόνο μηδέν, ειδικά από μικρές επιχειρήσεις με ομάδες προγραμματιστών μεγέθους 1-2.

MeiliSearch

Μία από τις καλύτερες και υψηλής αξίας μηχανές αναζήτησης που θα συναντήσετε είναι η MeiliSearch.

Λοιπόν, τι με κάνει να αναφέρω το MeiliSearch στις κορυφαίες συστάσεις μου;

Εδώ πάει.

Ανοιχτή πηγή

Όλος ο πηγαίος κώδικας που τροφοδοτεί το MeiliSearch είναι διαθέσιμος ανοιχτά στο GitHub. Αυτό σημαίνει ότι οι προγραμματιστές μπορούν να εξετάσουν οι ίδιοι οποιοδήποτε μέρος του κώδικα. Σε αντάλλαγμα, οι επιχειρήσεις μπορούν να βεβαιωθούν για την ποιότητα και την πρόθεση (για παράδειγμα, δεν υπάρχουν backdoors ή σαρωτές στο πρόγραμμα). Και, φυσικά, οι έμπειροι προγραμματιστές μπορούν να βοηθήσουν στη βελτίωση της τεχνολογίας ακόμη περισσότερο.

Εξαιρετικό UX

Το MeiliSearch δεν έχει περίπλοκους κανόνες (όπως το “a – b” σημαίνει a αλλά όχι b). Απλώς πληκτρολογήστε την αναζήτησή σας φυσικά και τα αποτελέσματα θα αρχίσουν να εμφανίζονται ομαλά. Ο κινητήρας είναι εξαιρετικά ανεκτικός και ευχάριστος, παρέχοντας ακριβή αποτελέσματα ακόμα και όταν χρησιμοποιούνται τυπογραφικά λάθη ή συνώνυμα. Υποστηρίζει επίσης πολλές γλώσσες.

Υπέροχο DevEx

Οι προγραμματιστές θα λατρέψουν το MeiliSearch! Δεν είναι μόνο προσαρμόσιμο και επεκτάσιμο, αλλά διασυνδέεται ως REST API! Η τεκμηρίωση είναι επίσης εξαιρετική και πλήρης. Ενώ η πραγματοποίηση κλήσεων HTTP είναι ασήμαντη σε οποιαδήποτε γλώσσα, δίνονται παραδείγματα από πέντε γλώσσες (JavaScript, Ruby, Python, Golang και PHP) για όσους βιάζονται πολύ.

Οι απλές λύσεις αναζήτησης θα πρέπει να είναι απλές στη χρήση και στη ρύθμιση. Ως εκ τούτου, το MeiliSearch ελέγχει όλα τα πλαίσια! Όταν είστε πρόθυμοι να προχωρήσετε, ξεκινήστε το στο DigitalOcean με ένα κλικ.

Solr

Το Solr, μέρος του Apache Project, υπάρχει εδώ και μερικά χρόνια. Είναι χτισμένο στη γνωστή και εξαιρετικά αξιόπιστη βιβλιοθήκη Lucene, η οποία τροφοδοτεί επίσης τη δημοφιλή λύση αναζήτησης που ονομάζεται ElasticSearch. Όλο αυτό το mumbo-jumbo σημαίνει ότι η Solr συγκαταλέγεται στις πιο ισχυρές, επεκτάσιμες, συμβατές με πρότυπα, πλούσιες σε χαρακτηριστικά και αξιόπιστες λύσεις αναζήτησης.

Χρησιμοποιείται από μεγαθήρια όπως η Disney, το eBay, το Netflix, το Zappos και το BestBuy. Ωστόσο, αυτό δεν σημαίνει ότι δεν μπορείτε να εκτελέσετε μια μικρότερη, απλούστερη εγκατάσταση (ας πούμε, με ένα μηχάνημα, χωρίς κλιμάκωση, χωρίς failover — καλά, μερικές φορές είναι εντάξει) και να χρησιμοποιήσετε αυτό το δυναμικό που ονομάζεται Solr.

Λοιπόν, γιατί να χρησιμοποιήσετε το Solr;

Εδώ είναι μερικοί εξαιρετικοί λόγοι.

Ακριβές και ισχυρό

Το Solr είναι ένα από τα πιο ακριβή, ικανά και ισχυρά συστήματα αναζήτησης στον κόσμο. Επιπλέον, είναι ανοιχτού κώδικα, γεγονός που εξηγεί γιατί μεγάλα ονόματα (όπως αναφέρθηκε προηγουμένως) το έχουν κάνει beeline. Η ικανότητά του να αφομοιώνει έγγραφα και να απαντά σε ερωτήματα αναζήτησης δεν υστερεί σε καμία.

Απλή εγκατάσταση και συντήρηση

Η εγκατάσταση του Solr είναι τόσο απλή όσο η αποσυμπίεση και η εκτέλεση του προγράμματος. Για απλά συστήματα ενός μηχανήματος, δεν απαιτείται δύσκολη συντήρηση. Παρακολουθήστε τη χρήση της μνήμης RAM, καθώς οι λύσεις αναζήτησης γενικά και οι τεχνολογίες που βασίζονται σε Java ειδικότερα μπορεί να απαιτούν μνήμη RAM (επειδή διατηρούν ή προσπαθούν να διατηρήσουν τα πάντα στη μνήμη RAM για γρήγορη ανάγνωση/εγγραφή).

Πίνακας Διαχειριστή

Το Solr συνοδεύεται από έναν πίνακα διαχείρισης που επιτρέπει οπτική παρακολούθηση και διαμόρφωση. Με κάποιο ασήμαντο ποσό εκπαίδευσης, ακόμη και οι μη προγραμματιστές μπορούν να μάθουν να διαβάζουν τα βασικά γραφήματα. Δεν υπάρχουν πολλές λύσεις αναζήτησης σε αυτήν τη λίστα με λειτουργικότητα όπως αυτή.

Πηγή εικόνας: Επίσημος ιστότοπος

Με γνώμονα το API, συμβατό με πρότυπα

Το Solr παρέχει μια διεπαφή αποτελεσμάτων σε ένα API που μπορεί να χειριστεί πολλές μορφές — JSON, CSV, XML και δυαδικό. Εξάγει δεδομένα παρακολούθησης σύμφωνα με το πρότυπο JMX, ένα τεράστιο όφελος για τους προγραμματιστές Java.

Υπάρχουν πολλά περισσότερα που πρέπει να πούμε υπέρ του Solr, αλλά η προσπάθεια να καλύψουμε τα πάντα θα μας πάει στο τέλος του χρόνου. 😂 Αρκεί να πούμε ότι το Solr είναι μια κορυφαία λύση και δεν μπορείτε ποτέ να κάνετε λάθος με αυτό, ανεξάρτητα από τον τύπο δεδομένων με τον οποίο εργάζεστε.

  Πόσα χρήματα εξοικονομείτε με το Apple One;

Elasticsearch

Το Elasticsearch ήταν, και αναμφισβήτητα εξακολουθεί να είναι, πρωτοπόρος στην αναζήτηση κειμένου ελεύθερης μορφής. Στην πραγματικότητα, ακόμη και σήμερα, αν ζητήσετε από έναν προγραμματιστή ή έναν sysadmin μια σύσταση για τις μηχανές αναζήτησης, το Elasticsearch είναι πολύ πιθανό να είναι το μόνο όνομα που θα βρει. Σίγουρα, αυτές τις μέρες, ένα μεγάλο κομμάτι θα προτείνει κάτι σαν το Algolia επίσης, αλλά έχουμε ήδη καλύψει πώς γίνεται αυτό. 🤪

Μην παραπλανηθείτε από το κουμπί “Έναρξη δωρεάν δοκιμής” στο παραπάνω γράφημα. Ενώ η ίδια η βασική τεχνολογία Elasticsearch είναι ανοιχτού κώδικα και δωρεάν, η εταιρεία προσπαθεί να κερδίσει χρήματα από τις προσπάθειές της και να στοχεύσει επιχειρήσεις. Ως εκ τούτου, αυτό που βλέπετε εδώ είναι στην πραγματικότητα η δοκιμή για την υπηρεσία cloud τους, καθιστώντας εύκολη τη διαχείριση του Elasticsearch, ειδικά όταν εμπλέκονται συμπλέγματα.

Ουφ, τόσοι ιστοί για να ξεμπλέξουμε. Ας ανακεφαλαιώσουμε: Το Elasticsearch είναι ανοιχτού κώδικα και δωρεάν, και ο καθένας μπορεί να το ρυθμίσει εύκολα και να το χρησιμοποιήσει χωρίς περιορισμούς.

Και τώρα, όπως ήταν αναμενόμενο, ας βουτήξουμε στους λόγους επιλογής του Elasticsearch:

  • Ώριμη, δοκιμασμένη στη μάχη μηχανή αναζήτησης. Αυτό σημαίνει ότι είναι πολύ πιο πιθανό να βρείτε λύσεις εάν έχετε κολλήσει με «περίεργα» σφάλματα.
  • Εστίαση πρώτης κατηγορίας στην ομαδοποίηση, την επεκτασιμότητα και τις ασύγχρονες εγγραφές.
  • Προσβάσιμο μέσω ενός απλού REST API (το οποίο κατέληξαν να αντιγράψουν όλοι οι άλλοι).
  • Προσανατολίζεται στα έγγραφα, αλλά υποστηρίζει σχήμα εάν χρειάζεται.
  • Τρελά γρήγορα και ακριβή αποτελέσματα. Ρυθμιζόμενη ταχύτητα αναζήτησης.
  • Αστρική τεκμηρίωση, ως προς το ποσό αλλά και τη χρησιμότητα.
  • Μια πλήρης πλατφόρμα αναζήτησης και ανάλυσης cloud (η στοίβα ELK), εάν θέλετε να πληρώσετε για την ευκολία.

Το μόνο nit-pick που θα είχα ενάντια στο Elasticsearch είναι η τεράστια κατανάλωση RAM. Θέλω να πω, ως σύμβουλοι, είναι αρκετά δύσκολο να πείσεις τους πελάτες να επενδύσουν σε έναν διακομιστή κοστίζει 20 $/μήνα, ο οποίος δυστυχώς δεν είναι καθόλου κοντά σε αυτό που απαιτεί η Elasticsearch.

Εάν είστε περίεργοι να μάθετε το Elasticsearch, τότε ρίξτε μια ματιά σε αυτό το μάθημα Udemy.

Typesense

Το Typesense είναι μια ελαφριά, απλή, αλλά ισχυρή μηχανή αναζήτησης. Όσοι αναζητούν χρησιμότητα και απλότητα θα πρέπει οπωσδήποτε να το δοκιμάσουν.

Ένα από τα καλύτερα πράγματα για το Typesense είναι ότι μπορείτε να το δοκιμάσετε απευθείας στον ιστότοπό του. Αυτό μπορεί να εξοικονομήσει απογοήτευση και χρόνο σε περιπτώσεις όπου ρυθμίζετε τα πάντα και δοκιμάζετε το API. . . μόνο για να διαπιστώσετε ότι μία ή περισσότερες από τις λειτουργίες δεν λειτουργούν με τον τρόπο που θα θέλατε.

Αυτό δεν σημαίνει ότι μπορεί να υπάρχουν σφάλματα στον κινητήρα. Απλώς, η ανάληψη του κινητήρα για κάτι μπορεί να μην είναι η προτίμησή σας ή μπορεί να έρχεται σε πλήρη σύγκρουση με τον τομέα της επιχείρησής σας. Τυπογραφικά λάθη, ειδικά σύμβολα, συνώνυμα και άλλα . . . μπορείτε να ελέγξετε τα αποτελέσματα που βγάζει ο κινητήρας απευθείας στην αρχική σελίδα (χρησιμοποιούν μια βάση δεδομένων βιβλίων για αυτό).

Όπως μπορείτε να δείτε, αυτή η ενότητα βρίσκεται ακριβώς κάτω από την κορυφαία. Στο πλαίσιο αναζήτησης, έχω εισαγάγει το ερώτημα “tra” και παρακάτω βλέπω αποτελέσματα που ταιριάζουν από τη βάση δεδομένων βιβλίων (καθώς και μεταδεδομένα — συνολικά αποτελέσματα, τρέχουσα σελίδα κ.λπ.).

Το Typesense έχει πολλά να το κάνει όταν πρόκειται για μια μηχανή αναζήτησης επιλογής:

  • Η τεχνολογία πίσω από αυτό είναι πλήρως ανοιχτού κώδικα και φιλόξενη.
  • Εύκολη διαμόρφωση μιας ρύθμισης HA (High Availability), αν χρειαστείτε.
  • Ανεκτικό όταν πρόκειται για τυπογραφικά λάθη και άλλους θορύβους στα ερωτήματα αναζήτησης.
  • Ένα προηγμένο σύστημα φιλτραρίσματος για όσους χρειάζονται λεπτό έλεγχο των αποτελεσμάτων αναζήτησης.
  • Απλό REST API, αν και τα έγγραφά τους θα σας κάνουν να εργαστείτε πολύ σκληρά για να το βρείτε!
  • Οι πελάτες (SDK) είναι διαθέσιμοι για ορισμένες από τις κύριες γλώσσες (JavaScript, Python, Ruby και PHP).

Τέλος, αν βρίσκετε κουραστική την ιδέα της δημιουργίας νέων διακομιστών, το Typesense διαθέτει επίσης μια προσφορά cloud όπου η παροχή χρειάζεται ένα μόνο κλικ. Η χρέωση είναι ανά ώρα και η ανάγνωση και η εγγραφή είναι αμέτρητες. Ειλικρινά, θα πω ότι αυτή είναι η καλύτερη επιλογή για τις περισσότερες επιχειρήσεις, υπό την προϋπόθεση ότι έχουν επεξεργαστεί την τιμολόγηση εκ των προτέρων και έχουν βεβαιωθεί ότι είναι ένα καθαρό κέρδος.

Συνολικά, το Typesense έχει πολύ νόημα (χωρίς λογοπαίγνιο!) αν χρειάζεστε κάτι μικρό, λείο, ακριβές και ένα πραγματικό άλογο.

  Κάθε συντόμευση πληκτρολογίου ζουμ και πώς να τις χρησιμοποιήσετε

Ηχητικός

Η Sonic υπερηφανεύεται ότι είναι μια εναλλακτική λύση ElasticSaerch που λειτουργεί με «λίγα MB RAM».

Πώς είναι αυτό δυνατόν?

Λοιπόν, η Java Virtual Machine (JVM) είναι γνωστό ότι είναι πεινασμένη για RAM (γενικά, μόλις ξεκινήσετε το JVM τρώει περίπου 1 GB μνήμης RAM). Δεν αποτελεί έκπληξη, λοιπόν, ότι κάτι κωδικοποιημένο στη γλώσσα Rust (που παρέχει πλήρη έλεγχο και ασφάλεια μνήμης για προγραμματιστές) μπορεί να τρέξει εξίσου γρήγορα και να χρησιμοποιεί μόνο λίγα MB RAM.

Χαλαρώστε όλοι! Αυτή είναι απλώς η μασκότ του έργου.

Μέχρι τη στιγμή που γράφω, υπάρχουν μερικές εταιρείες που αναφέρονται μεταξύ των χρηστών του, αν και είμαι σίγουρος ότι υπάρχουν μερικές ακόμη που δεν μπήκαν στον κόπο να προσθέσουν τα ονόματά τους. Δεν θυμάμαι πώς ή το ακριβές χρονικό πλαίσιο, αλλά έχω συναντήσει το Sonic νωρίτερα. εκείνη τη στιγμή, ενώ ήμουν χαρούμενος που είδα μια εναλλακτική λύση χαμηλής μνήμης, σκέφτηκα ότι θα χρειαζόταν χρόνο για να σταθεροποιήσω και να ξεκαθαρίσω τα κρυμμένα σφάλματα. Λοιπόν, φαίνεται ότι έχουν φτάσει λίγο πολύ. Το πόσο δημοφιλές θα γίνει το Sonic είναι κάτι που θα δείξει μόνο ο χρόνος.

Εντάξει, εκτός από τόσες πολλές μηρυκασίες, γιατί να σκεφτείτε να χρησιμοποιήσετε το Sonic για τον οργανισμό/το έργο σας;

Εδώ είναι μερικοί λόγοι:

  • Εξαιρετικά χαμηλό αποτύπωμα μνήμης, όσον αφορά τις μηχανές αναζήτησης.
  • Οι βιβλιοθήκες είναι διαθέσιμες για όλες τις κύριες γλώσσες προγραμματισμού. Node, PHP και Rust είναι αυτά που κυκλοφόρησαν οι ίδιοι οι συγγραφείς, ενώ άλλα δημιουργήθηκαν από την κοινότητα (να χαίρεστε, γιατί καλύπτονται και εξωτικά σκληρά όπως το Elixir και το Nim!).
  • Υποστηρίζονται πολλές γλώσσες (ήταν πάρα πολύ για να μετρήσω, αλλά νομίζω ότι από τη στιγμή της γραφής, υποστηρίζονται 40-50 γλώσσες).
  • Μια έκπληξη! Μπορείτε ακόμη και να χρησιμοποιήσετε νέες γλώσσες και ο κινητήρας θα λειτουργήσει (😂😂), αν και θα χάσετε ορισμένες προηγμένες λειτουργίες, όπως λέξεις διακοπής.
  • Πολύ γρήγορος κινητήρας. Αν ελέγξετε τη σελίδα τους στο GitHub, θα δείτε ότι ο χρόνος απορρόφησης και αναζήτησης ήταν σε μικροδευτερόλεπτα σε αρκετές περιπτώσεις! Φυσικά, αυτή ήταν μια δοκιμή ενός μηχανήματος, καθώς η καθυστέρηση δικτύου δεν θα αφήσει ποτέ τους αριθμούς να είναι τόσο χαμηλοί.

Εάν θέλετε να δείτε αυτήν τη μηχανή σε δράση, μεταβείτε σε αυτόν τον σύνδεσμο (μία από τις εταιρείες χρηστών της) και παίξτε με το πλαίσιο αναζήτησης που βλέπετε εκεί:

Υπάρχουν ορισμένοι περιορισμοί στο Sonic ως μηχανή αναζήτησης. Οι προγραμματιστές τα έχουν επισημάνει και τα έχουν συζητήσει ανοιχτά στη σελίδα τους στο GitHub. Η συμβουλή μου θα ήταν να εξετάσετε προσεκτικά αυτήν τη λίστα και να διαπιστώσετε ότι οι περιπτώσεις χρήσης σας δεν είναι κοινές με τον τομέα τους. Τούτου λεχθέντος, όλα έχουν περιορισμούς. είναι απλώς ότι κρατούνται κρυφά, και έτσι δεν το καταλαβαίνουμε μέχρι να είναι πολύ αργά. Ως εκ τούτου, θεωρώ ότι το Sonic είναι μια εξαιρετική επιλογή για μια μηχανή αναζήτησης.

TNTSearch

Τώρα έχουμε μια συναρπαστική καταχώρηση σε αυτή τη λίστα. Το πρώτο ενδιαφέρον είναι ότι αυτή η μηχανή αναζήτησης με πλήρη λειτουργία, έτοιμη για παραγωγή, γράφτηκε σε PHP!

Ναι, από όλες τις δυνατές γλώσσες, PHP. Και το λέω αυτό όχι επειδή μισώ την PHP αλλά επειδή είναι μια βραχύβια διαδικασία από το σχεδιασμό.

Το δεύτερο ενδιαφέρον είναι η άδεια τους, τουλάχιστον ως προς τη συγγραφή. Στην πραγματικότητα, η ίδια η άδεια είναι MIT, επομένως δεν υπάρχουν προβλήματα, αλλά οι συγγραφείς ταξινομούν αυτό το λογισμικό ως PS4Ware. Εάν χρησιμοποιείτε το TNTSearch στην παραγωγή, θα πρέπει να τους στείλετε ένα παιχνίδι PS4! 😂😂 Τώρα, δεν είναι υποχρεωτικό, όπως υποδηλώνει το «πρέπει», αλλά είναι αστείο πέρα ​​για πέρα. Ελπίζω επίσης να το αναβαθμίσουν σε άδεια PS5, αν και είναι πολύ νωρίς αυτή τη στιγμή.

Τέλος πάντων, προερχόμενος από ένα ισχυρό υπόβαθρο PHP + Laravel ο ίδιος, εκτιμώ ιδιαίτερα τις προσπάθειες αυτών των ανδρών. Ο ιστότοπός τους δεν λέει πολλά, αλλά φαίνεται να δείχνει ότι είναι σύμβουλοι, γι’ αυτό σας συνιστώ ανεπιφύλακτα να επικοινωνήσετε μαζί τους εάν έχετε έργα!

Τώρα, υπάρχουν καλοί λόγοι για να χρησιμοποιήσετε το TNTSearch στα έργα σας;

Ναι υπάρχουν:

  • Κωδικοποιημένο σε PHP, για PHP, από PHP. Το οικοσύστημα PHP χρειάζεται πιο εξειδικευμένες, υψηλής ποιότητας λύσεις όπως αυτή.
  • Σημαντικά χαρακτηριστικά όπως η ασαφής αναζήτηση, η γεωαναζήτηση και η ταξινόμηση κειμένου.
  • Εύκολη αλλαγή του ευρετηρίου αναζήτησης, κάτι που λείπει μεγάλη ευελιξία από πολλές λύσεις.
  • Το στέλεχος, η κατάταξη BM25 και το προσαρμοσμένο tokenization εξασφαλίζουν υψηλή ακρίβεια.
  • Εύκολη ανάπτυξη — όπως κάθε άλλο πακέτο Composer!
  Πώς να δημιουργήσετε ένα Screencast με το Microsoft PowerPoint

Μπορείτε να ελέγξετε την απόδοση του κινητήρα εδώ και να δείτε μόνοι σας πόσο γρήγορο και ακριβές είναι. Θα τονίσω ξανά την πτυχή της PHP: εάν διατηρείτε ένα έργο PHP, θέλετε να παραμείνετε εντός των τειχών της PHP όσο το δυνατόν περισσότερο (γιατί; σκεφτείτε το κόστος επανεκπαίδευσης). Και για τέτοιες περιπτώσεις, το TNTSearch φέρνει μια πρόταση αξίας που δύσκολα μπορείς να αρνηθείς!

Vespa

Η Vespa είναι μια ευρεία και βαρέων βαρών προσφορά. Όπως μερικές άλλες καταχωρήσεις σε αυτήν τη λίστα, είναι πολύ μεγάλη για να αποτυπωθεί με λίγα λόγια. Αλλά πρέπει να προσπαθήσω, έτσι θα το κάνω. 🙂 Η Vespa είναι μια μηχανή αναζήτησης, σίγουρα, αλλά η χρήση της ως μια συνηθισμένη μηχανή αναζήτησης θα σπαταλήσει τις δυνατότητές της.

Η Vespa κατασκευάστηκε για να χειρίζεται ατελείωτες ποσότητες δεδομένων (Big Data) και να παρέχει λειτουργίες που βασίζονται στη Μηχανική Μάθηση και ατελείωτη προσαρμογή πάνω από αυτό.

Η Vespa τοποθετείται ως ανταγωνιστής του Elasticsearch και των παραδοσιακών βάσεων δεδομένων και παρέχει μια αξιοπρεπή σύγκριση για το τι πρέπει να χρησιμοποιηθεί και πότε.

Όπως μπορείτε να δείτε, όσο πιο κοντά θέλετε να φτάσετε στις λειτουργίες που βασίζονται στη Μηχανική Μάθηση, τόσο πιο νόημα έχει η Vespa. Ως καθαρή μηχανή αναζήτησης για μια επιχείρηση μικρού έως μεσαίου επιπέδου, δεν νομίζω ότι έχει κανένα πλεονέκτημα σε σχέση με άλλες επιλογές.

Τώρα, λαμβάνοντας υπόψη ότι παράγετε τεράστιες ποσότητες δεδομένων συνεχώς και θέλετε να βελτιώσετε τη λήψη αποφάσεων μέσω AI/ML (μια περιγραφή που ταιριάζει σε πολλές επιχειρήσεις SaaS σήμερα), να γιατί η Vespa έχει πολύ νόημα:

  • Ανοιχτός κώδικας: Χωρίς περίεργες άδειες και χωρίς συμβόλαια παγίδευσης. Και δεν υπάρχει τίποτα για να πληρώσουν επιπλέον, αν και τονίζω πάντα ότι οι εταιρείες πληρώνουν ένα τακτικό ποσό στα έργα που χρησιμοποιούν περισσότερο (ακόμα και 50 $/μήνα θα τις βοηθήσουν πολύ).
  • Σε πραγματικό χρόνο: Η Vespa είναι πραγματικά σε πραγματικό χρόνο. Δεν μπορεί μόνο να αφομοιώσει, να θρυμματίσει και να αναζητήσει δεδομένα καθώς εισέρχονται. ακόμη και η διαμόρφωσή του μπορεί να τροποποιηθεί εν κινήσει.
  • Κλιμακόμενη και ανεκτική: Η Vespa είναι ασήμαντη στην κλίμακα. Επίσης, ανταποκρίνεται πολύ καλά στην ξαφνική εξαφάνιση κόμβων, παρέχοντας υψηλή αξιοπιστία.
  • Κατάταξη και προτάσεις: Οι προτάσεις αναζήτησης, κατάταξης και Vespa μπορούν να συνδυαστούν με δομημένα ερωτήματα για να προσφέρουν πραγματικά ακριβή αποτελέσματα.
  • Ανώδυνη AI/ML: Η Vespa συνοδεύεται από υψηλής ποιότητας, προεκπαιδευμένα μοντέλα ML. Δεν χρειάζεται να προσλάβετε 20 επιστήμονες δεδομένων για να καθαρίσετε και να χρησιμοποιήσετε τα δεδομένα σας.
  • Προσαρμοσμένες προσθήκες: Υπάρχει ένα πλήρες σύνολο API που βοηθούν τους προγραμματιστές να δημιουργήσουν προσαρμοσμένες προσθήκες Java, εάν χρειαστεί να αλλάξουν τον τρόπο λειτουργίας του κινητήρα.

Η Vespa είναι τεράστια, χωρίς αμφιβολία, επομένως είναι ξεκάθαρο για ομάδες που είναι λίγο πιο πέρα ​​από την αρχική βαθμίδα – είτε πρόκειται για το μέγεθος της ομάδας, την τεχνολογική ικανότητα, τους προϋπολογισμούς υποδομής, τον ημερήσιο όγκο δεδομένων ή κάτι άλλο. Για αυτό το τμήμα, η Vespa θα φτάσει στο σπίτι και συνιστάται ιδιαίτερα.

Ambar

Για ορισμένες επιχειρήσεις, τα δεδομένα αναζήτησης δεν μετασχηματίζονται και αποθηκεύονται ήδη ως έγγραφα JSON. μάλλον, είναι ένα χάος με την πραγματική έννοια της λέξης — μια χαοτική συλλογή όλων των ειδών εγγράφων όπως Word, PDF, αρχεία HTML κ.λπ. Εάν είστε ένας από αυτούς και πιστεύετε ότι δεν υπάρχει ελπίδα για εσάς, πείτε γεια στον Ambar!

Το καλύτερο πράγμα για το Ambar είναι ο μεγάλος τύπος αρχείων με τον οποίο μπορεί να λειτουργήσει:

  • Μορφές αρχείων MS Office (.docx, .xlsx, κ.λπ.), συμπεριλαμβανομένων των PowerPoint, Visio και Publisher!
  • Μορφές αρχείων OpenOffice
  • Έγγραφα PDF με αυτόματη OCR που εφαρμόζεται για την εξαγωγή πληροφοριών.
  • εικόνες
  • Μορφές αρχειοθέτησης email όπως το PST (γεια σας, χρήστες του Outlook!)
  • Μηνύματα email με συνημμένα

Τα καλούδια δεν τελειώνουν επίσης εδώ. Το Ambar είναι σε θέση να λειτουργεί με μεγάλα αρχεία (πάνω από 30 MB), αρχεία ZIP και multithreading για πλήρη χρήση της CPU και ταχύτερα αποτελέσματα. Έτσι, αν έχετε έγγραφα αξίας ετών που βρίσκονται σε κάποιον δίσκο σε έναν ξεχασμένο διακομιστή, ήρθε η ώρα να τα φέρετε πίσω και να τα τροφοδοτήσετε όλα στην Ambar!

συμπέρασμα

Η αναζήτηση 🔎 είναι ισχυρή, η αναζήτηση είναι μαγική και η αναζήτηση είναι παντού!

Μπορεί ακόμη και να είναι μαύρη μαγεία, αλλά σήμερα δεν υπάρχει κανένας λόγος για τον οποίο όλοι (με κάποια βοήθεια προγραμματιστή, φυσικά) δεν μπορούν να καρπωθούν τα οφέλη της. Από επιχειρήσεις έως ιδιώτες και κυβερνήσεις, οι μηχανές αναζήτησης σε αυτήν τη λίστα παρέχουν σχεδόν μηδενική προσφορά με εκθετικά οφέλη και αντίκτυπο.

Προχωρήστε και αποκτήστε έναν διακομιστή cloud και εγκαταστήστε το παραπάνω λογισμικό αναζήτησης που θέλετε να δοκιμάσετε.