Πώς να κάνετε μουσική AI με το MusicGen της Meta

Η Meta κυκλοφόρησε τον κώδικα για το MusicGen, μια άλλη συσκευή παραγωγής μουσικής AI που μπορεί να μετατρέψει τις περιγραφές κειμένου σε μουσικές μελωδίες. Το demo μπορεί να βρεθεί στο διαδίκτυο και χρειάζεστε μόνο ένα πρόγραμμα περιήγησης για να το δοκιμάσετε. Τα αποτελέσματα δεν είναι άσχημα, αλλά περισσότερο από αυτό, δείχνει πόσο πολύ έχουν προχωρήσει τα μουσικά μοντέλα AI.
Εδώ είναι τι πρέπει να γνωρίζετε για το MusicGen και πώς να δημιουργείτε μουσική.
Πίνακας περιεχομένων
Τι είναι το MusicGen;
Τον Ιούνιο του 2023, η Meta κυκλοφόρησε το μοντέλο της μουσικής γενιάς με τεχνητή νοημοσύνη που ονομάζεται MusicGen. Δεν είναι η πρώτη εταιρεία που αντιμετωπίζει το περίπλοκο πρόβλημα της σύνθεσης ακατέργαστης μουσικής από μια απλή περιγραφή κειμένου. μέχρι στιγμής, μπορείτε να δημιουργήσετε μουσική με το Jukebox του OpenAI ή να δημιουργήσετε αποσπάσματα τραγουδιών με το MusicLM.
Αλλά είναι η πρώτη εταιρεία που έκανε τον κώδικα ανοιχτού κώδικα, επιτρέποντάς σας να εκτελείτε το λογισμικό τοπικά στον υπολογιστή σας, εάν έχετε GPU με ελάχιστη μνήμη 16 GB — αν και μπορέσαμε να το κάνουμε να λειτουργεί με μόλις 11 GB.
Μην ανησυχείτε αν δεν έχετε το υλικό, γιατί μπορείτε να δοκιμάσετε την εφαρμογή web MusicGen δωρεάν χρησιμοποιώντας ένα πρόγραμμα περιήγησης. Από τη διαδικτυακή επίδειξη, μπορείτε να περιμένετε ότι θα χρειαστεί λίγο περισσότερο από ένα λεπτό για τη δημιουργία ενός αποσπάσματος ήχου διάρκειας περίπου 12 δευτερολέπτων.
Πώς ακούγεται το MusicGen;
Σύμφωνα με το Meta, το MusicGen μπορεί να παράγει δείγματα μουσικής υψηλής ποιότητας, αν και ανακαλύψαμε ότι οι ερευνητές που συμμετείχαν όρισαν την υψηλή ποιότητα ως τα 32 kHz. Αυτό βρίσκεται κάπου ανάμεσα στις απαιτήσεις της σύνθεσης ομιλίας (16kHz) και του προτύπου για την ψηφιακή μουσική (44,1kHz).
Στην πραγματικότητα, ο ήχος δεν πληροί τα ελάχιστα πρότυπα ποιότητας που μπορεί να έχετε συνηθίσει να ακούτε στο ραδιόφωνο ή στις πλατφόρμες ροής. Ωστόσο, σε σύγκριση με άλλες γεννήτριες μουσικής τεχνητής νοημοσύνης και λαμβάνοντας υπόψη πού βρίσκεται η τεχνολογία τη στιγμή της γραφής, η ποιότητα ήχου είναι αρκετά καλή με χαμηλό επίπεδο θορύβου στο αρχείο.
Πόσο κοντά ευθυγραμμίζεται η μουσική με τις προτροπές; Μπορείτε να αποκτήσετε γρήγορα μια αίσθηση αυτού ακούγοντας τα παραδείγματα που δημιουργήσαμε παρακάτω. Σε γενικές γραμμές, καταφέρνει να εμμείνει στα δημοφιλή είδη μουσικής, ενώ διατηρεί μια πιο συνεκτική μουσική δομή σε σύγκριση με τους προκατόχους του.
Πώς να δημιουργήσετε μουσική χρησιμοποιώντας το MusicGen
Το MusicGen είναι εύκολο στη χρήση και δεν απαιτεί να εγγραφείτε. Η διεπαφή είναι επίσης απλή, καθιστώντας εύκολη τη δοκιμή για διασκέδαση.
Δείτε πώς μπορείτε να δημιουργήσετε μουσική με το MusicGen:
Η ρύθμιση σε μια μελωδία θα χρησιμοποιεί τόσο την περιγραφή του κειμένου όσο και τη μελωδία που παρέχετε ως αναφορά. Αυτό είναι ένα χρήσιμο εργαλείο για τη διαμόρφωση των αποτελεσμάτων που λαμβάνετε από το MusicGen.
Ποιοι είναι οι περιορισμοί στη χρήση του ήχου MusicGen;
Ο κώδικας για το MusicGen διανέμεται ελεύθερα υπό την άδεια MIT με λίγους περιορισμούς. Όσον αφορά τον ήχο που δημιουργείτε χρησιμοποιώντας το μοντέλο, δεν είναι σαφές εάν υπάρχουν νομικές οδηγίες. Αντ ‘αυτού, μπορεί να θέλετε να προσέξετε Η προειδοποίηση του Meta για τη χρήση του MusicGen:
«Το μοντέλο δεν πρέπει να χρησιμοποιείται για τη σκόπιμη δημιουργία ή διάδοση μουσικών κομματιών που δημιουργούν εχθρικά ή αλλοτριωτικά περιβάλλοντα για τους ανθρώπους. Αυτό περιλαμβάνει τη δημιουργία μουσικής που οι άνθρωποι θα θεωρούσαν αναμενόμενα ενοχλητική, οδυνηρή ή προσβλητική. ή περιεχόμενο που διαδίδει ιστορικά ή τρέχοντα στερεότυπα».
Ο Meta εξηγεί περαιτέρω ότι το MusicGen προορίζεται για ερευνητές που επιθυμούν να εξερευνήσουν την παραγωγή μουσικής με τεχνητή νοημοσύνη και όχι για «μεταγενέστερες χρήσεις», που υποθέτουμε ότι σημαίνουν δραστηριότητες όπως η μεταφόρτωση και η διανομή μουσικής AI σε πλατφόρμες ροής.
Τα ηθικά πλεονεκτήματα και μειονεκτήματα αντικατοπτρίζουν τη γενιά τέχνης AI. Η απόκτηση συγκατάθεσης για τη χρήση δεδομένων για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης, καθώς και το πρόβλημα της αποζημίωσης/πιστοποίησης των καλλιτεχνών, όταν χρειάζεται, είναι όλοι λόγοι για να το παίξει η Meta ασφαλής.
Εν ολίγοις, η εξερεύνηση του μοντέλου για διασκέδαση είναι απίθανο να προκαλέσει βλάβη, αλλά μπορεί να είναι πιο ακανθώδες ζήτημα όταν πρόκειται για τη χρήση ήχου για εμπορική μουσική. Πολλοί άνθρωποι αναρωτιούνται πώς μοιάζει το μέλλον της ποπ μουσικής με AI.
Προσθέτοντας ένα ακόμη μοντέλο παραγωγής μουσικής σε αυτό που υπάρχει, η Meta κυκλοφόρησε το MusicGen, ένα μοντέλο τεχνητής νοημοσύνης ανοιχτού κώδικα ικανό να παράγει ακατέργαστη μουσική από μια απλή περιγραφή κειμένου. Εάν είστε περίεργοι να δοκιμάσετε την τεχνολογία, μπορείτε να κάνετε την επίδειξη για μια περιστροφή χρησιμοποιώντας απλώς ένα πρόγραμμα περιήγησης ιστού.