26 εκπληκτικά ανοιχτά σύνολα δεδομένων για τα έργα επιστήμης δεδομένων σας/ML

Η αναζήτηση για τα σωστά σύνολα δεδομένων μπορεί να είναι τρομακτική, ειδικά όταν τα χρειάζεστε για έργα μηχανικής μάθησης (ML) και επιστήμης δεδομένων. Μειώνουμε τις ερευνητικές σας προσπάθειες παρέχοντας την απόλυτη λίστα με δωρεάν σύνολα δεδομένων.

Τα σύνολα δεδομένων είναι απλώς συλλογές δεδομένων. Θα μπορούσαν να είναι οικονομικά, δεδομένα υγείας της κοινότητας, δεδομένα χρηματιστηρίου, τραπεζικά δεδομένα, γεωγραφικά δεδομένα, δεδομένα έρευνας επιστήμης σωματιδίων, αξιολογήσεις προϊόντων σε ιστότοπο ηλεκτρονικού εμπορίου κ.λπ.

Τα σύνολα δεδομένων περιέχουν δεδομένα που συλλέγονται μέσω ενός προτύπου επιστημονικής έρευνας και είναι σημαντικά για περαιτέρω οπτικοποίηση, εξαγωγή, πρόβλεψη κ.λπ. Δεδομένου ότι τα δεδομένα είναι ισοδύναμα του αργού πετρελαίου στο ψηφιακό σύμπαν, τα σύνολα δεδομένων γίνονται εμπορικά και σπάνια.

Συνεχίστε την ανάγνωση για να μάθετε τα βασικά σχετικά με τα σύνολα δεδομένων. Θα ανακαλύψετε επίσης ορισμένα σύνολα δεδομένων ανοιχτού κώδικα που είναι πραγματικά δωρεάν για έργα μηχανικής εκμάθησης (ML) ή επιστήμης δεδομένων.

Πίνακας περιεχομένων

Τι είναι τα σύνολα δεδομένων;

Τα σύνολα δεδομένων είναι η συλλογή δεδομένων σε ένα δομημένο και οργανωμένο κοντέινερ. Συνήθως, οι επιθεωρητές συνδέουν σύνολα δεδομένων με ένα μοναδικό σώμα, για παράδειγμα, τα Ανοιχτά Δεδομένα της Παγκόσμιας Τράπεζας.

Και πάλι, οι συλλέκτες δεδομένων διατηρούν τα σύνολα δεδομένων συγκεκριμένα για ένα θέμα όπως τα Δεδομένα Απογραφής 2020 των Ηνωμένων Πολιτειών της Αμερικής που δημοσιεύθηκαν από το Γραφείο Απογραφής των Ηνωμένων Πολιτειών.

Θα βρείτε πολλά σύνολα δεδομένων για παγκόσμια και τοπικά θέματα. Τα περισσότερα σύνολα δεδομένων περιέχουν αλληλένδετα σημεία δεδομένων. Για παράδειγμα, ο πληθυσμός μιας χώρας και πώς σχετίζεται η παχυσαρκία με διαφορετικές τάξεις αυτού του πληθυσμού.

Οι επιστήμονες δεδομένων μπορεί να χρειαστεί να καθαρίσουν, να αναδιαρθρώσουν και να επεξεργαστούν τέτοια σύνολα δεδομένων χρησιμοποιώντας εργαλεία μεγάλων δεδομένων για να καταλήξουν σε πολύτιμα συμπεράσματα όπως η μείωση των πλαστικών απορριμμάτων με την ανάλυση δεδομένων χρήσης πλαστικών, η επίλυση προβλημάτων εργατικού δυναμικού με την ανάλυση δεδομένων μισθών, η εκπαίδευση τεχνητής νοημοσύνης (AI) και ούτω καθεξής. επί.

Τύποι συνόλων δεδομένων

Ανάλογα με την πηγή των συνόλων δεδομένων, θα μπορούσαν να είναι δημόσια ή ιδιωτικά. Τα δημόσια σύνολα δεδομένων είναι ανοιχτά σε όλους και συμβάλλουν πολύ στην έρευνα και την ανάπτυξη.

Και πάλι, τα σύνολα δεδομένων μπορεί να είναι των ακόλουθων τύπων ανάλογα με τις πληροφορίες που περιέχονται σε αυτά:

  • Πολυμεταβλητή: Τέτοια δεδομένα περιέχουν πολλές μεταβλητές.
  • Κατηγορικό: Απεικονίζει πολλές κατηγορίες ανθρώπων.
  • Αριθμητικά: Τέτοια σύνολα δεδομένων μετρούν δεδομένα σε αριθμούς όπως ηλικία, ύψος κ.λπ.
  • Συσχέτιση: Σε αυτόν τον τύπο, τα σημεία δεδομένων είναι αλληλένδετα.
  • Βάσει αρχείου: Εδώ, τα σύνολα δεδομένων αποθηκεύονται σε αρχεία.
  • Διμεταβλητή: Ένα σύνολο δεδομένων με δύο μεταβλητές και μια σχέση μεταξύ τους.
  • Σύνολο δεδομένων Ιστού: Δεδομένα που συλλέγονται από μία ή πολλές παρόμοιες διαδικτυακές πύλες.
  • Βάση δεδομένων: Τέτοια σύνολα δεδομένων αποθηκεύουν δεδομένα σε πίνακες, στήλες και σειρές.
  Πώς να εγκαταστήσετε τα πινέλα στο Photoshop

Σύνολα δεδομένων ανοιχτού κώδικα για έργα επιστήμης δεδομένων

Τα δωρεάν σύνολα δεδομένων είναι το καύσιμο για να ενισχύσετε το πάθος σας για μια καριέρα στην επιστήμη δεδομένων. Διότι εάν βρίσκεστε στα πρώτα στάδια της καριέρας σας στην επιστήμη των δεδομένων, μπορεί να θέλετε να αναλάβετε προσωπικά και μη εμπορικά έργα για την αυτοπεποίθηση ή τη δημιουργία χαρτοφυλακίου.

Πρώτον, μπορείτε εύκολα να δοκιμάσετε τις δεξιότητές σας που έχετε μάθει πρόσφατα, εφαρμόζοντας εργαλεία και τεχνικές σε προβλήματα δεδομένων του πραγματικού κόσμου.

Για παράδειγμα, υπάρχουν ελεύθερα διαθέσιμα δεδομένα έρευνας για τον καρκίνο, δεδομένα Covid-19, δεδομένα ποινικών μητρώων του FBI, δεδομένα ανάλυσης σωματιδίων από το CERN κ.λπ. Μπορείτε να χρησιμοποιήσετε τέτοια δεδομένα και να δημιουργήσετε ένα μοντέλο επιστήμης δεδομένων για να απαντήσετε σε ζωτικά κοινωνικά, οικονομικά ζητήματα και θέματα υγείας .

Δεύτερον, τέτοια έργα λειτουργούν ως ενισχυτές χαρτοφυλακίου για την καριέρα σας. Εάν μπορείτε να δημιουργήσετε ένα επιτυχημένο μοντέλο ανάλυσης δεδομένων που μπορεί να προσφέρει χρήσιμες πληροφορίες, μπορείτε να παρουσιάσετε αυτά τα μοντέλα στο διαδίκτυο δημιουργώντας ιστότοπους χαρτοφυλακίου. Οι εργοδότες προτιμούν τα έργα από τις δηλώσεις σκοπού.

Δωρεάν σύνολα δεδομένων για έργα μηχανικής μάθησης

Όπως ένας επαγγελματίας της επιστήμης δεδομένων, ένας επαγγελματίας ML πρέπει επίσης να εργαστεί σε αυτοδιαχειριζόμενα έργα για να εξετάσει τις δεξιότητές του. Εάν το έργο γίνει επιτυχές, γίνεται επίσης ένα ιδανικό στοιχείο για το διαδικτυακό ή εκτός σύνδεσης χαρτοφυλάκιό σας έργων ML.

Επομένως, μπορείτε τώρα να καταλάβετε ότι η επιστήμη δεδομένων και η ανάπτυξη ML εξαρτώνται από δομημένα σύνολα δεδομένων. Εάν τέτοια σύνολα δεδομένων ήταν πολύ εμπορευματοποιημένα, η έρευνα και η ανάπτυξη στον τομέα της επιστήμης δεδομένων θα γινόταν πλήρως εταιρική.

Για να παραμείνει ανοιχτή σε όλους η έρευνα ML της επιστήμης δεδομένων, οι ακόλουθοι φορείς, ιδρύματα και πλατφόρμες προσφέρουν δωρεάν σύνολα δεδομένων:

Data.gov

Θα βρείτε όλα τα ανοιχτά δεδομένα που συλλέγονται και επεξεργάζονται η κυβέρνηση των ΗΠΑ. στο Data.gov. Η πλατφόρμα προσφέρει επίσης πόρους και εργαλεία για τη διεξαγωγή έρευνας, τον σχεδιασμό οπτικοποιήσεων δεδομένων, την ανάπτυξη εφαρμογών για κινητά/ιστό κ.λπ.

Τα αξιοσημείωτα σύνολα δεδομένων του περιλαμβάνουν δεδομένα βιώσιμης χρήσης γης, δεδομένα αγροτικών κατοικιών, χάρτες ηλεκτρονικής πλοήγησης στην ενδοχώρα κ.λπ.

Άνοιγμα συνόλων δεδομένων: Kaggle

Η Kaggle προσφέρει έναν ωκεανό από δημόσια δεδομένα και κωδικούς υπολογιστών για έργα επιστήμης δεδομένων. Μπορείτε να επιλέξετε Σύνολα δεδομένων για πρωτογενή δεδομένα και Κωδικός για κωδικούς προγραμματισμού. Τα ανερχόμενα σύνολα δεδομένων στο Kaggle είναι δεδομένα AMEX, Simpsons Viewership, δεδομένα εκπαίδευσης Chatbot κ.λπ.

Σύνολα δεδομένων τμήματος: YouTube 8-M

Τα σύνολα δεδομένων τμημάτων από το YouTube 8-M σάς προσφέρουν σχολιασμούς τμημάτων που επαληθεύονται από ανθρώπινους ελεγκτές. Μπορείτε επίσης να αποκτήσετε πρόσβαση στο σύνολο δεδομένων YouTube-8M από την ίδια πύλη. Το σύνολο δεδομένων περιέχει 6,1 εκατομμύρια αναγνωριστικά βίντεο, 350.000 ώρες βίντεο, 2,6 δισεκατομμύρια οπτικοακουστικά χαρακτηριστικά, 3863 κατηγορίες βίντεο και κατά μέσο όρο 3,0 ετικέτες ανά βίντεο.

Μητρώο Ανοικτών Δεδομένων στο AWS

Το ROD στο AWS βοηθά τους επιστήμονες δεδομένων να μοιράζονται και να ανακαλύπτουν σύνολα δεδομένων που φιλοξενούνται σε πόρους AWS. Μερικά ενδιαφέροντα σύνολα δεδομένων που μπορείτε να βρείτε εδώ είναι το The Cancer Genome Atlas, το Foldingathome COVID-19 Datasets, το Common Crawl κ.λπ.

Αποθετήριο Machine Learning: UCI

Το UCI Machine Learning Repository διατηρεί επί του παρόντος 622 σύνολα δεδομένων κατάλληλα για επιστήμονες δεδομένων και μηχανικούς ML για να εκπαιδεύσουν τα μοντέλα AI τους. Επίσης, υπάρχει μια διεπαφή με δυνατότητα αναζήτησης για την έρευνα των βάσεων δεδομένων. Δημοφιλή αξιοθέατα είναι το σύνολο δεδομένων επιταχυνσιόμετρο, το σύνολο δεδομένων σύγχρονης μηχανής, τα Βασικά μαθηματικά της Wikipedia, το σύνολο δεδομένων Τουρκικών επικεφαλίδων κ.λπ.

  Πώς να μοιραστείτε την οθόνη σας στο Google Meet

Δημόσια σύνολα δεδομένων BigQuery: Google Cloud

Πολλά δημόσια σύνολα δεδομένων αποθηκεύονται στο BigQuery. Η Google καθιστά δωρεάν προσβάσιμο το σύνολο δεδομένων μέσω του προγράμματος Google Cloud Public Dataset. Ωστόσο, το δωρεάν ερώτημα έχει όριο 1 TB ανά μήνα. Μπορείτε να εκτελέσετε τυπικά ερωτήματα SQL και παλαιού τύπου SQL.

Φοβερά δημόσια σύνολα δεδομένων: GitHub

Το Awesome Public Datasets είναι ένα σύνολο δεδομένων ανοιχτού κώδικα που περιέχει δημόσια δεδομένα με επίκεντρο το θέμα. Συλλέγεται και ταξινομείται από διάφορα ιστολόγια, απαντήσεις και σχόλια χρηστών, συνδυάζει δωρεάν και επί πληρωμή σύνολα δεδομένων σχετικά με τη φυσική, τον αθλητισμό, το λογισμικό, τη φυσική γλώσσα και τη μηχανική εκμάθηση.

Στοιχεία της Παγκόσμιας Τράπεζας

Η Παγκόσμια Τράπεζα Ανοικτά Δεδομένα είναι η πλατφόρμα όπου έχετε δωρεάν πρόσβαση σε δεδομένα παγκόσμιας ανάπτυξης. Προσφέρει επίσης άλλους πολύτιμους πόρους, όπως προδιαμορφωμένους πίνακες και αναφορές. Μπορείτε εύκολα να περιηγηθείτε ανά χώρα ή δείκτη για να λάβετε το απαιτούμενο σύνολο δεδομένων.

FiveThirtyEight: Δεδομένα

Το FiveThirtyEight είναι ένας αμερικανικός ιστότοπος που ασχολείται με την ανάλυση δημοσκοπήσεων, την πολιτική, την οικονομία και τον αθλητισμό. Μπορείτε να έχετε πρόσβαση σε αυτές τις δημοσκοπήσεις και προβλέψεις μέσω συνόλων δεδομένων από την πλατφόρμα της. Μπορείτε να κατεβάσετε τα σύνολα δεδομένων με ένα κλικ.

ImageNet

Το ImageNet είναι μια βάση δεδομένων εικόνων από την οποία οι ερευνητές σε όλο τον κόσμο μπορούν να λάβουν σύνολα δεδομένων ανοιχτού κώδικα για τα μη εμπορικά έργα τους. Εδώ, οι εικόνες οργανώνονται με βάση την ιεραρχία του WordNet. Το έργο διαδραματίζει ζωτικό ρόλο στην έρευνα βαθιάς μάθησης προηγμένου επιπέδου.

Αρχεία συνόλων δεδομένων: ΔΕΔΟΜΕΝΑ UNICEF

Χρησιμοποιώντας τα αρχεία συνόλων δεδομένων, μπορείτε να αποκτήσετε σύνολα δεδομένων που συλλέγονται από τη UNICEF σε όλο τον κόσμο. Δεδομένα για τη μετανάστευση, τον εκτοπισμό, τη διατροφή, τη συνδεσιμότητα, την εκπαίδευση, την υγεία, τη μάθηση, τη θνησιμότητα, τη βία, την παιδική ανάπτυξη, τον παιδικό γάμο, την παιδική εργασία και διάφορα στατιστικά στοιχεία είναι διαθέσιμα εδώ.

Εύρεση Ανοιχτών Δεδομένων: Govt. του ΗΒ

Εάν το έργο σας χρειάζεται δεδομένα που δημοσιεύονται από τοπικούς φορείς και την κεντρική κυβέρνηση του Ηνωμένου Βασιλείου, το Find Open Data είναι η πύλη που πρέπει να ελέγξετε. Καλύπτει τις κρατικές δαπάνες, τις επιχειρήσεις, την υγεία, την εκπαίδευση, την άμυνα και άλλα σύνολα δεδομένων.

Στοιχεία: Γραφείο Απογραφής Ηνωμένων Πολιτειών

Χρειάζεστε δεδομένα απογραφής των ΗΠΑ για ένα σχετικό έργο; Μπορείτε να λάβετε βοήθεια από τα δεδομένα USCB. Εδώ, μπορείτε να εξερευνήσετε δεδομένα απογραφής 2020, πίνακες, χάρτες και προφίλ δεδομένων, ενώ οπτικοποιείτε δεδομένα και χρησιμοποιείτε εργαλεία δεδομένων.

Δεδομένα και στατιστικές: CDC

Η ομοσπονδιακή υπηρεσία των Ηνωμένων Πολιτειών Κέντρα Ελέγχου και Πρόληψης Νοσημάτων παρέχει επίσης δωρεάν σύνολα δεδομένων στο κοινό για πρόσβαση σε δεδομένα και στατιστικά στοιχεία από αυτήν την πύλη. Τα θέματα του συνόλου δεδομένων είναι Περιβαλλοντική Υγεία, Χρόνιες Ασθένειες, Γεννήσεις και Γεννήσεις, Θάνατοι και Θνησιμότητα, Προσδόκιμο Ζωής, Τραυματισμοί & Βία, Αναπαραγωγική Υγεία, Εθνικές ασθένειες που κοινοποιούνται κ.λπ.

Σύνολα δεδομένων: MIT

Αυτό το σύνολο δεδομένων εστιάζει σε δεδομένα δόνησης επαγωγής δίνης. Το Center for Ocean Engineering στο MIT φιλοξενεί ορισμένα δημόσια διαθέσιμα σύνολα δεδομένων για συγκριτική αξιολόγηση κώδικα υπολογιστή. Τα σύνολα δεδομένων είναι ανοιχτά σε όλους για να προσκαλέσουν νέες θεωρίες από τα δεδομένα και να συγχρονίσουν ερευνητές που εργάζονται στον ίδιο τομέα.

Κατάλογος δεδομένων της Παγκόσμιας Τράπεζας

Ο Κατάλογος Δεδομένων συλλέγει δωρεάν σύνολα δεδομένων που κάνουν εύκολα προσβάσιμα τα δεδομένα της Παγκόσμιας Τράπεζας που σχετίζονται με την ανάπτυξη. Η χρήση του σε διάφορα έργα είναι παιχνιδάκι καθώς μπορείτε να βρείτε και να κατεβάσετε αβίαστα τις πληροφορίες που προτιμάτε. Περιέχει πάνω από 5000 σύνολα δεδομένων που καλύπτουν τα μικροδεδομένα, τα οικονομικά και τις ενεργειακές πλατφόρμες της Παγκόσμιας Τράπεζας.

  Πώς να εξάγετε καρέ από βίντεο

Δεδομένα Διαστημικής Επιστήμης της NASA

Η NASA προσφέρει πρόσβαση στα αρχειακά της δεδομένα στο Συντονισμένο Αρχείο Δεδομένων Διαστημικής Επιστήμης. Αυτή η πλατφόρμα είναι μια μεγάλη βοήθεια για το ευρύ κοινό, ειδικά τους ανθρώπους που εργάζονται στην εκπαίδευση και την διαστημική έρευνα. Διαθέτει 400 TB ψηφιακών δεδομένων που περιέχουν πληροφορίες για 550 διαστημικές επιστήμες.

Λάβετε τα δεδομένα: Inside Airbnb

Η Airbnb είναι μια παγκοσμίου φήμης διαδικτυακή αγορά για κατοικίες και ενοικιάσεις διακοπών. Προσφέρει επίσης συλλογή δεδομένων για διάφορες πόλεις παγκοσμίως από το Get the Data. Μπορείτε να περιηγηθείτε στην πόλη για να λάβετε γρήγορα τα δεδομένα. Επιπλέον, μπορείτε να ζητήσετε τα απαιτούμενα δεδομένα σας και να διαβάσετε τις υποθέσεις δεδομένων σε αυτήν την πύλη.

Δεδομένα Ιστού: Κριτικές Amazon

Όσοι ενδιαφέρονται για έρευνα αγοράς και κριτικές προϊόντων θα πρέπει να χρησιμοποιήσουν τα σύνολα δεδομένων που παρέχονται από το Snap Web Data. Περιέχει περισσότερες από 34 εκατομμύρια κριτικές χρηστών στο Amazon, από τον Ιούνιο του 1995 έως τον Μάρτιο του 2013. Το σύνολο δεδομένων περιέχει απλό κείμενο, πληροφορίες προϊόντος, όνομα χρήστη, αξιολογήσεις και μια κριτική.

Στοιχεία ΔΝΤ

Η πύλη δεδομένων του ΔΝΤ είναι πολύτιμη για όλους τους τύπους οικονομικών και χρηματοοικονομικών δεδομένων. Είτε αναζητάτε δεδομένα χρηματοδότησης του ΔΝΤ, στατιστικά στοιχεία εξωτερικού τομέα, εμβληματικές δημοσιεύσεις ή δεδομένα μικροοικονομίας, εδώ μπορείτε να τα βρείτε. Επιπλέον, μπορείτε να χρησιμοποιήσετε ένα φίλτρο για να λάβετε δεδομένα ανά χώρα.

Βιβλία Google Ngrams

Εάν εργάζεστε σε μέρη του λόγου και της γλώσσας, τα Βιβλία Google Ngrams μπορούν να σας βοηθήσουν σημαντικά. Αυτό το σύνολο δεδομένων ανοιχτού κώδικα σάς δίνει μια ιδέα σχετικά με τη χρήση μιας συγκεκριμένης λέξης και φράσης σε όλη την ιστορία ή ένα συγκεκριμένο χρονικό εύρος. Η πηγή αυτού του συνόλου δεδομένων είναι τα ψηφιακά έγγραφα που ευρετηριάζονται από την Google.

Δεδομένα αγορών: The Financial Times

Εάν θέλετε να αποκτήσετε αξιόπιστα και ακριβή δεδομένα παγκόσμιας και περιφερειακής αγοράς μετοχών, τα Markets Data από τους The Financial Times είναι εδώ για να σας βοηθήσουν. Σας δίνει τη δυνατότητα να εργάζεστε με δεδομένα αγοράς από την Αμερική, την Ασία-Ειρηνικό, την Ευρώπη, την Αφρική και την παγκόσμια αγορά.

Earth Data: NASA

Η NASA παρέχει πλήρη και ανοιχτή πρόσβαση στα επιστημονικά της δεδομένα μέσω του προγράμματος Earth Data που σας βοηθά να κατανοήσετε τον πλανήτη μας και να κάνετε έργα με αυτόν. Μπορείτε να βρείτε δωρεάν σύνολα δεδομένων για την ατμόσφαιρα, τη βιόσφαιρα, την κρυόσφαιρα, τις ανθρώπινες διαστάσεις, την επιφάνεια της γης, τον ωκεανό, τη στερεά γη, την αλληλεπίδραση ήλιου-γης και την επίγεια υδρόσφαιρα.

Αναζήτηση συνόλου δεδομένων: Google

Εάν είστε φοιτητής, ερευνητής ή επιστήμονας δεδομένων που αναζητά σύνολα δεδομένων για την υποστήριξη του έργου σας, μπορείτε να λάβετε βοήθεια από την πύλη αναζήτησης συνόλου δεδομένων. Μπορείτε να το ονομάσετε μηχανή αναζήτησης για σύνολα δεδομένων, καθώς σας επιτρέπει να ανακαλύπτετε σύνολα δεδομένων που φιλοξενούνται σε διάφορες αναφορές στον ιστό μέσω της αναζήτησης λέξεων-κλειδιών.

Ανοιχτά δεδομένα: CERN

Ο ευρωπαϊκός ερευνητικός οργανισμός CERN διαθέτει μια πύλη Ανοικτών Δεδομένων που μπορείτε να χρησιμοποιήσετε για να αποκτήσετε πρόσβαση στα δεδομένα που δημιουργούνται από την έρευνα στο CERN. Αυτή η πύλη συνόλου δεδομένων περιέχει δύο petabyte δεδομένων που σχετίζονται με τη σωματιδιακή φυσική. Επιπλέον, συνοδεύεται από εφαρμογές και τεκμηρίωση που απαιτούνται για την ανάλυση δεδομένων.

Crime Data Explorer: FBI

Το Crime Data Explorer (CDE) είναι το σύνολο δεδομένων ανοιχτού κώδικα από το FBI που στοχεύει να παρέχει ευκολότερη πρόσβαση σε κοινοποίηση δεδομένων εγκληματικών, μη εγκληματικών και αστυνομικών. Εκτός από το ότι σας επιτρέπει να ανακαλύψετε τα απαραίτητα δεδομένα μέσω οπτικοποίησης και φιλτραρίσματος κατηγοριών, αυτή η πλατφόρμα σάς επιτρέπει να κάνετε λήψη δεδομένων σε μορφή CSV.

Τελικές Λέξεις

Μέχρι στιγμής, έχετε περάσει από μια πραγματικά εξαντλητική λίστα συνόλων δεδομένων υψηλής ποιότητας. Το άρθρο παρουσιάζει δεδομένα από διάφορες θέσεις όπως η φυσική επιστήμη, τα ιατρικά αρχεία, η διαστημική έρευνα, τα ποινικά μητρώα, οι αξιολογήσεις προϊόντων κ.λπ.

Ανάλογα με το έργο της επιστήμης δεδομένων ή της μηχανικής μάθησης που είστε έτοιμοι, μπορείτε να επιλέξετε. Σχεδόν όλα τα σύνολα δεδομένων έχουν επίσης κατάλληλες οδηγίες για να σας βοηθήσουν με το έργο σας.

Μπορεί επίσης να σας ενδιαφέρουν αυτοί οι πόροι για να μάθετε την επιστήμη δεδομένων και την ML.