10 RegEx Tester για JavaScript, Python, PHP, Golang, Ruby κ.λπ.

Η έκφραση Regex μπορεί να είναι πόνος. Λοιπόν, μερικές φορές!

Ας μάθουμε για τις κανονικές εκφράσεις και τα μοτίβα τους. Θα εξετάσουμε τέτοια μοτίβα που φαίνονται σαν μια περίπλοκη σούπα χαρακτήρων. Θα δούμε τι σημαίνει κάθε χαρακτήρας σε μια κανονική έκφραση.

Αφού διαβάσετε αυτό το άρθρο, θα μπορείτε να δημιουργήσετε τις κανονικές σας εκφράσεις και να τις χρησιμοποιήσετε όπως θέλετε. Στο τέλος, θα παραθέσουμε επίσης μερικά από τα διαδικτυακά εργαλεία δοκιμών RegEx, ώστε με βάση τις απαιτήσεις να μπορείτε να δημιουργήσετε το RegEx σας και να το δοκιμάσετε χρησιμοποιώντας αυτά τα εργαλεία.

Εισαγωγή

Κανονικές εκφράσεις ή όπως είναι κοινώς γνωστό – RegEx είναι οποιαδήποτε ακολουθία χαρακτήρων που μπορεί να χρησιμοποιηθεί ως μοτίβο για την αναζήτηση χαρακτήρων ή συμβολοσειρών.

Για παράδειγμα – για να προσδιορίσουμε εάν μια συμβολοσειρά ή φράση περιέχει τη λέξη “μήλο”, μπορούμε να χρησιμοποιήσουμε το regex “/apple” για να πραγματοποιήσουμε αναζήτηση μέσα στη συμβολοσειρά. Ως άλλο παράδειγμα, μπορούμε να χρησιμοποιήσουμε το “/[0-9]” για να ελέγξετε εάν μια δεδομένη συμβολοσειρά περιέχει έναν αριθμό μεταξύ 0 και 9.

Κανονικές εκφράσεις και η χρήση τους

Οι τυπικές εκφράσεις χρησιμοποιούνται ευρέως για διάφορους σκοπούς στις σύγχρονες λειτουργίες που σχετίζονται με τον ιστό. Η επικύρωση φορμών Ιστού, οι μηχανές αναζήτησης Ιστού, οι λεξικοί αναλυτές σε IDE, οι επεξεργαστές κειμένου και οι επεξεργαστές εγγράφων είναι μερικά παραδείγματα όπου χρησιμοποιούνται συχνά κανονικές εκφράσεις.

  Πώς να υποτονίσετε μια CPU για να αυξήσετε την απόδοση του υπολογιστή

Όλοι έχουμε χρησιμοποιήσει πολλές φορές το “CTRL + F” για αναζήτηση σε ένα έγγραφο ή ένα κομμάτι κώδικα για να βρούμε μια συγκεκριμένη λέξη ή μια φράση ή μια έκφραση. Αυτή η λειτουργία μπορεί να επισημανθεί ως ένα πολύ συνηθισμένο παράδειγμα χρήσης κανονικών εκφράσεων.

Πριν προχωρήσουμε περαιτέρω, ας ρίξουμε μια ματιά σε μια πολύ συχνά χρησιμοποιούμενη κανονική έκφραση.

Μπορείτε να μαντέψετε 🤔 το παρακάτω RegEX σε τι χρησιμοποιείται;

^([a-zA-Z0-9_-.]+)@([a-zA-Z0-9_-.]+).([a-zA-Z]{2,5})$

Μην ανησυχείτε αν δεν μπορείτε να το μαντέψετε. Είμαι σίγουρος ότι θα μπορούσατε να μαντέψετε μέχρι το τέλος αυτού του άρθρου.

Πρώτα ας ξεκινήσουμε με τα Α, Β, Γ του RegEx.

Μαρτυρίες

Αρχικά, ας δούμε τα διάφορα σύμβολα στο Regex που φαίνεται παραπάνω.

^([a-zA-Z0-9_-.]+)@([a-zA-Z0-9_-.]+).([a-zA-Z]{2,5})$

Αν κοιτάξουμε το regex που δίνεται παραπάνω, μπορούμε να δούμε ότι αποτελείται από πολλά σύμβολα ή χαρακτήρες ή διακριτικά. Ας μάθουμε τι σημαίνουν:

Ενδειξη

Εννοια

^

Αυτό το διακριτικό υποδηλώνει την αρχή μιας συμβολοσειράς.

(…)

Αυτό υποδηλώνει μια ομάδα όπου όλα όσα δίνονται εντός (…) συλλαμβάνονται.

[…]

ο [] περικλείει χαρακτήρες με οποιονδήποτε από τους οποίους μπορεί να αντιστοιχιστεί. Για παράδειγμα – [abc] θα ταιριάζει είτε με το α είτε το β είτε το γ.

αζ

Το σύνολο των πεζών αλφαβήτων από το α έως το ω. Πρέπει να έχουμε κατά νου ότι το Regex κάνει διάκριση πεζών-κεφαλαίων.

  Πώς να εξαιρέσετε έναν τομέα από τα αποτελέσματα αναζήτησης Google

ΑΖ

Το σύνολο των κεφαλαίων χαρακτήρων από το Α έως το Ω.

0-9

Τα ψηφία από το 0 έως το 9.

_

Αυτό θα ταιριάζει με τον χαρακτήρα _.

Αυτός είναι ο χαρακτήρας απόδρασης.

.

Αυτό ταιριάζει με τον χαρακτήρα “.” Κυριολεκτικά. Αυτό χρησιμοποιείται επειδή το σύμβολο “.” στο regex είναι ένα διακριτικό από μόνο του που ταιριάζει με οποιονδήποτε χαρακτήρα

+

Αυτός είναι ένας ποσοτικός δείκτης. Αυτό ταιριάζει με έναν ή περισσότερους χαρακτήρες με τους οποίους χρησιμοποιείται. Για παράδειγμα, a+ σημαίνει μία ή περισσότερες εμφανίσεις του χαρακτήρα a.

Αυτό θα ταιριάζει με τον χαρακτήρα “-“.

@

Αυτό θα ταιριάζει με τον χαρακτήρα “@”.

{}

Αυτός είναι ένας άλλος ποσοτικός δείκτης. Χρησιμοποιείται για να δηλώσει τον αριθμό των εμφανίσεων ενός χαρακτήρα. Για παράδειγμα, a{3} σημαίνει ακριβώς 3 α.

$

Αυτό υποδηλώνει το τέλος μιας συμβολοσειράς.

Αναλύστε το δεδομένο μοτίβο Regex

Τώρα, οπλισμένοι με αυτήν την προκαταρκτική γνώση των διακριτικών, ας προσπαθήσουμε να αποκωδικοποιήσουμε την παραπάνω κανονική έκφραση:

  • ^([a-zA-Z0-9_-.]+) σημαίνει ότι αναζητούμε μια συμβολοσειρά που ξεκινά με τουλάχιστον έναν ή περισσότερους κεφαλαίους ή πεζούς αλφαριθμητικούς χαρακτήρες, κάτω παύλες, παύλες ή τελείες. Για παράδειγμα, οτιδήποτε μοιάζει με user_name.01 θα ταιριάζει με το μοτίβο. Πρέπει να θυμόμαστε ότι εδώ δεν χρειάζεται να συμπεριλάβουμε όλα τα σύμβολα μόνο έναν χαρακτήρα [a-zA-Z0-9_-.] θα κάνω.
  • Ο χαρακτήρας @ ταιριάζει για μια μεμονωμένη εμφάνιση του @. Προσθέτοντας στο προηγούμενο παράδειγμα, κάτι σαν [email protected] θα ταιριάξει.
  • ([a-zA-Z0-9_-.]+) είναι παρόμοιο με το πρώτο σημείο. Σημαίνει επίσης ότι αναζητούμε μια συμβολοσειρά που περιέχει τουλάχιστον έναν ή περισσότερους αλφαριθμητικούς χαρακτήρες, κάτω παύλες, παύλες ή τελείες. Προσθέτοντας στο παράδειγμα, [email protected] θα χωρέσει εδώ.
  • Όπως ίσως έχετε ήδη μαντέψει, υπονοούμε ένα μοτίβο email. Προχωράω, . ταιριάζει με το σινγκλ “.” χαρακτήρας. Αν συνεχίσουμε με το συνεχιζόμενο παράδειγμα, κάτι σαν [email protected]
  • ([a-zA-Z]{2,5})$ αυτό σημαίνει ότι η συμβολοσειρά πρέπει να τελειώνει με 2 έως 5 χαρακτήρες αλφάβητου είτε κεφαλαία είτε πεζά. Αν προσθέσουμε .com στο προηγούμενο παράδειγμα, μπορούμε να πάρουμε [email protected]που είναι το κοινό μοτίβο μιας συμβολοσειράς email.
  Η εφαρμογή του προγράμματος επεξεργασίας HTML εντός των εφαρμογών σας είναι εύκολη με το Froala – Επεξεργαστής WYSIWYG επόμενης γενιάς

Συνδυάζοντας όλα τα παραπάνω, μπορούμε να δούμε ότι αναζητούμε μια συμβολοσειρά αναγνωριστικού email. Τώρα μπορούμε να χρησιμοποιήσουμε αυτήν την έκφραση για να επικυρώσουμε οποιοδήποτε αναγνωριστικό email. Εάν το δοκιμαστικό αναγνωριστικό email μας ταιριάζει με αυτό το μοτίβο, μπορούμε να πούμε ότι είναι ένα έγκυρο αναγνωριστικό email.

ΥΓ – Αυτό είναι ένα μοτίβο για τα πιο κοινά αναγνωριστικά email στον ιστό.

Τύποι Μαρκών

Πολλά διακριτικά μπορούν να χρησιμοποιηθούν σε διάφορους συνδυασμούς μέσα σε ένα Regex για να περιγράψουν μια μεγάλη ποικιλία εκφράσεων. Παρακάτω θα ρίξουμε μια ματιά στους διάφορους τύπους διακριτικών που χρησιμοποιούνται σε κανονικές εκφράσεις. Επιπλέον, θα εξετάσουμε επίσης τα πιο συχνά χρησιμοποιούμενα διακριτικά σε κάθε κατηγορία.

Βασικά Tokens

Ας ξεκινήσουμε με τα βασικά διακριτικά. Αυτά τα διακριτικά χρησιμοποιούνται σχεδόν με κάθε κανονική έκφραση. Ως εκ τούτου, πρέπει πρώτα να μάθουμε γι ‘αυτούς.

Ενδειξη

Εννοια

r

Αυτό ταιριάζει με τον χαρακτήρα επιστροφής μεταφοράς.