Jak wygenerować muzykę AI w 2023 r. (samouczek)

Opublikowany: 2023-09-02

Czy kiedykolwiek marzyłeś o zostaniu zawodowym muzykiem, ale nie miałeś talentu muzycznego? Dzięki sztucznej inteligencji (AI) możliwe jest teraz tworzenie niesamowitych utworów za pomocą jedynie podpowiedzi tekstowych. Generatory muzyki AI są obecnie najgorętszym trendem w AI i nie bez powodu. Osoby posiadające niewielkie lub żadne zdolności muzyczne mogą tworzyć wspaniałe ścieżki dźwiękowe do wykorzystania w postach w mediach społecznościowych, filmach na YouTube i nie tylko. W tym poście wyjaśnimy, jak działa generatywna sztuczna inteligencja i jak w kilku krokach generować muzykę AI.

Zanurzmy się.

Spis treści

1 Czym jest muzyka AI?
2 Jak działa muzyka AI?
- 2.1 Rekurencyjne sieci neuronowe
- 2.2 Generacyjne sieci przeciwnika
- 2.3 Wstępnie wytrenowane transformatory generatywne
- 2.4 Wyszukiwanie informacji muzycznych (MIR)
3 zalety wykorzystania sztucznej inteligencji do generowania muzyki
4 Jak wygenerować muzykę AI
- 4.1 1. Zarejestruj darmowe konto
- 4.2 2. Poznaj interfejs Mubert
- 4.3 3. Wygeneruj swój pierwszy utwór muzyczny AI
- 4.4 4. Pobierz swój utwór
- 4.5 5. Dodaj swój utwór w Mubert Studio
5 generatorów muzyki AI z głosem
- 5.1 Landr
- 5.2 Syntezator V
- 5.3 Odwołaj
6 Przyszłość muzyki AI
7 końcowych przemyśleń na temat generowania muzyki AI

Co to jest muzyka AI?

Od czasu wprowadzenia generatywnej sztucznej inteligencji w 2015 r. pojawiły się różne formy sztucznej inteligencji, w tym zamiana tekstu na mowę, przetwarzanie języka naturalnego i generatory grafiki AI. Podobnie jak inne formy, muzyka AI wykorzystuje podpowiedzi tekstowe do generowania utworów muzycznych z różnymi instrumentami, stylami i gatunkami. Może także tworzyć kompozycje, modyfikować istniejącą muzykę, a nawet generować wokale.

Oto krótki klip, który wygenerowaliśmy przy użyciu Muberta za pomocą krótkiego komunikatu tekstowego:

Jak działa muzyka AI?

Podobnie jak inne formy generatywnej sztucznej inteligencji, oprogramowanie używane do tworzenia muzyki opiera się na systemach komputerowych głębokiego uczenia się, szkolonych na ogromnych ilościach danych muzycznych, takich jak utwory, artyści i gatunki. Modele te mogą opierać się na rekurencyjnych sieciach neuronowych (RNN), generatywnych sieciach przeciwstawnych (GAN), generatywnych wstępnie wyszkolonych transformatorach (GPT) lub wyszukiwaniu informacji muzycznych (MIR). Aby pomóc Ci zrozumieć znaczenie tych terminów, przyjrzyjmy się, czym są poszczególne terminy.

Rekurencyjne sieci neuronowe

Rekurencyjne sieci neuronowe (RNN) to wyspecjalizowane sieci neuronowe, które doskonale rozumieją i przetwarzają dane pojawiające się w sekwencjach, takich jak zdania lub szeregi czasowe. Działają w sposób podobny do sposobu, w jaki nasz mózg przetwarza informacje. Mówiąc najprościej, sieci RNN mogą przewidywać wyniki na podstawie danych sekwencyjnych, z czym borykają się inne algorytmy sztucznej inteligencji. Sieci RNN są szczególnie przydatne w przypadku danych, które mają określoną kolejność lub wzór, np. muzykę.

Generacyjne sieci przeciwstawne

Chociaż są używane głównie do generowania obrazów, awatarów i innych form sztucznej inteligencji, są również wykorzystywane do tworzenia muzyki AI. Składa się z dwóch części, generatora i dyskryminatora, GANS wykorzystuje te dwie sieci neuronowe do szkolenia systemów w zakresie generowania muzyki. Dyskryminator służy do określenia, czy podane dane wejściowe są prawdziwe, czy fałszywe. Zadaniem generatora jest oszukanie dyskryminatora. Podczas tysięcy sesji treningowych generator będzie poprawiał wyniki do tego stopnia, że dyskryminator nie będzie w stanie dostrzec różnicy. W przypadku generowania obrazu jest to stosunkowo proste zadanie. Jednak w przypadku muzyki istnieją niemal nieograniczone zmienne, w tym instrumenty, gatunek, styl, synchronizacja i wiele innych.

Transformatory generatywne, wstępnie wytrenowane

Stworzone przez ludzi stojących za ChatGPT, generatywne, wstępnie wytrenowane transformatory to zaawansowane modele językowe, które łączą moc transformatorów i wstępnego uczenia. Uczą się na podstawie dużych ilości danych i potrafią generować tekst, obrazy i muzykę przypominające ludzkie. Model GPT oparty na muzyce polega na wprowadzaniu sekwencji początkowej, która pozwala modelowi przewidzieć następną nutę lub akordy w utworze.

Wyszukiwanie informacji muzycznych (MIR)

MIR to dziedzina badań i rozwoju technik umożliwiających komputerom analizowanie, rozumienie i wydobywanie informacji z danych muzycznych. Działa jako pomost między muzyką a maszyną, wykorzystując algorytmy sztucznej inteligencji do przetwarzania i interpretowania treści muzycznych. Na przykład, korzystając z MIR, maszyny mogą nauczyć się klasyfikowania muzyki według gatunków, nastrojów lub innych klas w oparciu o funkcje audio i metadane. Następnie maszyny wykorzystują te informacje do generowania oryginalnej muzyki na podstawie tempa, wzorców rytmicznych, struktury harmonicznej lub akordów, żeby wymienić tylko kilka.

Korzyści z wykorzystania sztucznej inteligencji do generowania muzyki

Jedną z największych zalet generatorów muzyki AI jest ich łatwość użycia. Weźmy na przykład Muberta (więcej omówimy w dalszej części tego wpisu). Piszesz krótki opis muzyki, którą chcesz stworzyć, a w ciągu kilku minut będziesz mieć gotowy utwór w tle do wykorzystania w swoich kreatywnych projektach. Programy te oferują także dodatkową zaletę w postaci produkcji muzyki bez licencji, co oznacza, że możesz używać wygenerowanej muzyki w dowolnym miejscu, bez kłopotów z umowami lub umowami prawnymi.

Kolejnym kluczowym czynnikiem, który sprawia, że generatory muzyki AI są tak atrakcyjne, jest cena. Większość platform oferuje bezpłatne użytkowanie lub kosztuje nie więcej niż 20-30 dolarów miesięcznie, zapewniając dostępność nawet najbardziej oszczędnym klientom. Wreszcie narzędzia te zapewniają również wysoki poziom dostosowywania. Wiele programów AI, takich jak Landr, udostępnia aplikacje do pobrania, które umożliwiają edycję klipów muzycznych, dodawanie wokali, a nawet łączenie z innymi utworami. W przeszłości zadania te wymagały rozległej wiedzy w zakresie programów do edycji muzyki, ale dzięki mocy sztucznej inteligencji każdy może stać się mistrzem muzyki.

Jak wygenerować muzykę AI

Do generowania muzyki AI możesz użyć kilku programów, ale w tym samouczku pokażemy, jak to zrobić za pomocą Muberta.

Muzyka Muberta AI

Mubert to doskonały generator muzyki, który pozwala tworzyć spersonalizowaną muzykę do utworów w tle. Muzykę można tworzyć za pomocą aplikacji internetowej lub interfejsu API. Główną zaletą Muberta jest łatwość użycia. Za pomocą prostych podpowiedzi tekstowych możesz generować ścieżki dźwiękowe do gier, filmów marketingowych, aplikacji i nie tylko. Dostępne są zarówno plany bezpłatne, jak i płatne, a darmowa wersja umożliwia utworzenie do 25 bezpłatnych utworów. Jeśli jednak korzystasz z bezpłatnej wersji, będziesz musiał przypisać użycie, łącząc się z ich witryną internetową.

Przyjrzyjmy się krokom tworzenia pierwszego arcydzieła.

1. Zarejestruj darmowe konto

Pierwszym krokiem jest założenie bezpłatnego konta. Zacznij od przejścia do strony internetowej Mubert i kliknięcia przycisku rejestracji .

Zarejestruj się Mubert

Możesz zalogować się za pomocą Google lub Facebooka lub utworzyć nowe konto, podając swój adres e-mail i hasło. Po zakończeniu kliknij przycisk utwórz konto .

utwórz konto Muberta

Mubert wyśle Ci e-mail z kodem weryfikacyjnym, który musisz podać, aby ukończyć proces rejestracji.

Weryfikacja adresu e-mail

Po pobraniu kodu wklej go w wyświetlonym polu tekstowym i kliknij utwórz konto .

jak generować muzykę AI

2. Poznaj interfejs Mubert

Po utworzeniu konta po raz pierwszy zobaczysz intuicyjny interfejs Muberta. Możesz łatwo wygenerować nowy utwór (1) lub wyszukać według referencyjnego adresu URL (2), co wyjaśnimy szczegółowo w dalszej części tego wpisu. W międzyczasie, korzystając z funkcji generowania utworu, możesz wprowadzić monit tekstowy (3), ustawić czas trwania utworu (4) lub wybrać gatunek, nastrój lub czynność do wygenerowania muzyki (5). Po wypełnieniu wszystkich pól kliknij przycisk Generuj ścieżkę (6), aby przekonać się o potędze Muberta.

Interfejs Muberta

Jak wygenerować muzykę AI: gatunki

Gatunki Muberta

Zanim zajmiemy się tworzeniem pierwszego utworu muzycznego AI za pomocą podpowiedzi tekstowej, przyjrzyjmy się gatunkom w Mubert. Świetnie nadają się do tworzenia muzyki w określonym stylu, na przykład ambientowym, klasycznym czy rockowym. Ci, którzy potrzebują pomocy w zakresie tego, co wpisać w podpowiedzi, mogą do komponowania muzyki używać wstępnie zdefiniowanych stylów, takich jak gatunki. Na przykład, jeśli wybierzesz gatunek EDM , możesz wygenerować klip z mocną linią bazową.

Jak wygenerować muzykę AI: nastroje

Nastroje Muberta

Podobnie możesz wybrać nastroje, takie jak piękny, spokojny, energetyzujący lub inne, aby nadać ton swojemu klipowi. Na przykład stworzyliśmy ten 15-sekundowy utwór, wybierając nastroje piękne i spokojne .

Jak generować muzykę AI: zajęcia

Działalność Muberta

Na koniec możesz zastosować styl aktywności do swojej muzyki, wybierając jedno z gotowych ustawień aktywności, na przykład relaks, skupienie, gra lub sport. Możesz na przykład wybrać aktywność związaną ze snem , a następnie wybrać podkategorię, taką jak deszcz , aby stworzyć realistyczne dźwięki deszczu, które można wykorzystać w innych projektach.

Zauważmy, że wybranie wielu kategorii jednocześnie nie jest możliwe w przypadku korzystania z ustawień wstępnych. Na przykład, jeśli wybierzesz nastrój, nie możesz jednocześnie wybrać gatunku ani aktywności. Jeśli chcesz połączyć gatunki, nastroje lub czynności, możesz wpisać monit.

3. Wygeneruj swój pierwszy utwór muzyczny AI

Pokażemy Ci, jak wygenerować muzykę AI, wyświetlając monit tekstowy dotyczący tego kroku. Aby zmniejszyć rozmiar naszego posta, użyjemy 15-sekundowego czasu trwania, ale możesz wybrać dowolną długość czasu. Podobnie jak w przypadku innych generatywnych AI, mniej tekstu jest lepsze. Jest to szczególnie prawdziwe w przypadku Muberta. Używanie długich, opisowych podpowiedzi prawdopodobnie spowoduje zamieszanie i wygenerowanie niepożądanych wyników. Dlatego najlepiej, aby podpowiedzi były krótkie i zwięzłe.

Zacznij od wpisania w polu tekstowym następującego znaku zachęty: Progressive, wokal, tribal, house, minimal (1). Następnie ustaw czas trwania na 15 sekund (2), a następnie kliknij wygeneruj ścieżkę (3). Gdy utwór będzie już gotowy, będzie on widoczny bezpośrednio pod elementami sterującymi. Następnie kliknij ikonę odtwarzania (4), aby wyświetlić podgląd utworu. Możesz kliknąć przycisk Regeneruj, jeśli chcesz zregenerować ścieżkę w oparciu o ten sam monit (5). Jeśli jesteś zadowolony z wyników, kliknij ikonę pobierania , aby zapisać go (6) w swoich pobranych plikach. Pamiętaj, że darmowi użytkownicy mogą mieć maksymalnie 25 utworów, więc jeśli nie podoba Ci się wynik, pamiętaj o jego usunięciu (7).

ustawienia ścieżki

Jeśli regenerujesz utwór, możesz wybierać pomiędzy utworem, pętlą, miksem lub jinglem. Wybierzemy ustawienie miksu i utrzymamy długość ścieżki na 15 sekund.

typy torów

Oto oryginalny utwór przed zmiksowaniem:

To jest zremiksowany utwór:

Wyszukiwanie według referencji

Oprócz tworzenia muzyki AI za pomocą podpowiedzi tekstowych lub ustawień wstępnych możesz skorzystać z funkcji wyszukiwania według referencji. Ta funkcja umożliwia wprowadzenie adresu URL YouTube w celu wyszukiwania utworów zawartych w filmie. Na przykład użyjemy jednego z naszych własnych filmów, aby to przetestować. Wprowadź adres URL YouTube (1), a następnie kliknij przycisk wyszukiwania utworów (2).

wyszukiwanie według narzędzia referencyjnego

Z naszego doświadczenia wynika, że wyszukiwanie według filmu referencyjnego trwa nieco dłużej niż w przypadku podpowiedzi polegającej na zamianie tekstu na muzykę, a wyniki były różne. Dzieje się tak prawdopodobnie dlatego, że narzędzie jest wciąż w fazie beta, więc niewątpliwie istnieją pewne niedociągnięcia, które należy rozwiązać.

4. Pobierz swój utwór

Jak wspomniano, możesz pobierać i wykorzystywać swoje utwory w projektach. Jeżeli jednak korzystasz z darmowego konta, musisz przypisać treść Mubertowi. Aby pobrać zapisany utwór, przejdź do obrazu awatara w prawym górnym rogu ekranu, a następnie kliknij moje pobrane pliki .

Mubert pobiera

Stamtąd możesz kliknąć dowolny utwór, aby go pobrać.

pobierz utwór

Gdy pojawi się wyskakujące okienko, kliknij ikonę kopiowania (1), aby skopiować tekst autorstwa, a następnie kliknij opcję Zgadzam się i pobierz (2).

jak wygenerować muzykę AI

Jeśli chcesz mieć pełną kontrolę nad sposobem wykorzystania nowej muzyki AI, możesz wykupić płatną subskrypcję. Plany są niedrogie, a plan twórcy zaczyna się od zaledwie 11,69 USD miesięcznie. Niezależnie od subskrypcji nie możesz przesyłać swoich dzieł do Spotify, Apple Music ani tym podobnych. Możesz jednak sprzedać swój utwór w Mubert Studio, co omówimy w następnej sekcji.

Ceny Muberta

5. Dodaj swój utwór w Mubert Studio

Jednym z najlepszych aspektów Muberta jest możliwość generowania pasywnego dochodu z tworzonych utworów muzycznych AI. Korzystanie z Mubert Studio. Aby rozpocząć, kliknij przycisk współtworzenia na stronie głównej w obszarze Mubert Studio.

Pracownia Muberta

Następnie musisz skonfigurować swoje konto. Zacznij od podania swojego adresu e-mail (1), a następnie kliknij przycisk Kontynuuj (2).

Rejestracja Mubert Studio

Utwórz hasło (1), a następnie ponownie kliknij przycisk Kontynuuj (2).

Logowanie do Mubert Studio

Tworzenie pierwszego strumienia

Po zalogowaniu możesz utworzyć swój pierwszy strumień. Zacznij od kliknięcia przycisku tworzenia strumienia w lewym górnym rogu interfejsu.

Utwórz strumień

Po odświeżeniu ekranu zobaczysz kilka pustych pól. Wypełnisz je, aby wyświetlić listę utworów w Mubert's Studio. Zacznij od nadania swojej ścieżce nazwy (1), zdefiniuj tonację (2), skalę (3), uderzenia na minutę (BPM) (4) i przypisz czynność (5). To jedyne wymagane pola, ale wypełnienie pozostałych pól dotyczących nastroju, pogody, gatunku i tagów umożliwi innym użytkownikom znalezienie Twojego utworu podczas wyszukiwania.

ustawienia strumienia

Aby znaleźć tonację i BPM dla swojej ścieżki, przejdź do plików do pobrania w Mubert, a następnie kliknij ścieżkę, którą chcesz dodać do Studio.

informacje o utworze

Po ustawieniu parametrów kliknij przycisk dodawania/edytowania próbki, aby dodać ścieżkę.

prześlij utwór

Następnie kliknij przycisk Prześlij , aby dodać pobrany utwór z komputera. Uwaga: Studio nie pozwala na przesyłanie plików MP3, dlatego należy przekonwertować pobrany utwór na plik wav. Nie musisz się jednak martwić, do konwersji plików możesz użyć aplikacji typu open source, takiej jak odtwarzacz multimedialny VLC.

dodaj utwór

Po przesłaniu utworu upewnij się, że BPM i tonacja są zgodne, a następnie kliknij przycisk edycji ustawień strumienia .

edytować ustawienia strumienia

Na koniec możesz rozpocząć transmisję na żywo, klikając przycisk Zapisz transmisję .

zapisz strumień

Kliknij moje strumienie na stronie głównej, aby przeglądać, edytować lub słuchać swoich strumieni.

moje streamy

Generatory muzyki AI z głosem

Mubert świetnie nadaje się do generowania utworów w tle, ale co, jeśli potrzebujesz muzyki i wokalu? Istnieją dwa sposoby tworzenia ścieżek głosowych. Jeśli chcesz stworzyć lektora lub inną naturalnie brzmiącą mowę, możesz skorzystać z generatorów głosu AI. Jednak zazwyczaj nie zawierają narzędzia do śpiewania głosów. W takim przypadku będziesz potrzebować narzędzia audio AI. Jedno z narzędzi z tej listy zostało opisane w innym poście na blogu. Pozostałe dwie to aplikacje do pobrania, które pomagają tworzyć dzieła sztuki, łącząc głos i muzykę w tle.

Landr

Landr AI Audio

Landr to najwyżej oceniane narzędzie audio AI, które umożliwia tworzenie, edytowanie i dystrybucję muzyki za pomocą intuicyjnego interfejsu. Za jedną niską miesięczną cenę wynoszącą 12 USD otrzymasz dostęp do wirtualnego studia, w którym możesz z łatwością miksować i masterować swoje dzieła. Używana przez artystów nagrywających, takich jak Lady Gaga i Post Malone, Landr jest platformą, po którą chętnie sięgają profesjonaliści.

Cena: 12 dolarów miesięcznie.

Zdobądź Landra

Syntezator V

Syntezator V Studio

Dreamsonics Synthesizer V to kolejny doskonały program, jeśli chcesz tworzyć muzykę wraz z wokalami. Możesz tworzyć ścieżki za pomocą podpowiedzi tekstowych, a następnie zastosować swój ulubiony głos AI. Aplikację można pobrać bezpłatnie i zawiera przykładowe głosy AI, którymi można się bawić. Jeśli zdecydujesz, że jest to platforma dla Ciebie, możesz kupić wiele głosów AI. W bezpłatnej wersji możesz utworzyć do 3 utworów, co daje mnóstwo czasu na podjęcie decyzji, czy jest ona odpowiednia dla Twoich potrzeb.

Ceny: bezpłatne, pakiety zaczynają się od 79 USD.

Zdobądź Synthesizer V

Odwołaj

Rewokalizuj sztuczną inteligencję

Ostatnim narzędziem do wokalu jest Revocalize. Działa inaczej niż pozostałe narzędzia z naszej listy. Zamiast generować głosy za pomocą podpowiedzi tekstowej, możesz nagrać swój głos. Dzięki magii sztucznej inteligencji Revocalize zmienia i wzmacnia Twój głos oraz pozwala dodawać różne tony, efekty i tony. Co więcej, wykorzystują zastrzeżony algorytm, model śpiewu tożsamości głosowej (UVI), który chroni i zabezpiecza Twój głos. Ochrona praw autorskich daje Ci prawo do korzystania z nich według własnego uznania. Jest to doskonała funkcja, biorąc pod uwagę wszystkie problemy związane z prawami autorskimi, z którymi borykają się inne platformy AI.

Uwaga: jeśli chcesz uzyskać dostęp do bezpłatnej wersji Revocalize, musisz się zarejestrować i znajdować się na liście oczekujących.

Ceny: bezpłatne, plany miesięczne zaczynają się od 9 USD.

Pobierz Revocalize

Przyszłość muzyki AI

Przyszłość muzyki generowanej przez sztuczną inteligencję rysuje się w jasnych barwach. Niektórzy mogą postrzegać to jako zagrożenie dla rynku pracy lub ludzkiej kreatywności, ale to nieprawda. To znaczy, jeśli prawodawcy będą w stanie wprowadzić pewne zabezpieczenia prawne w celu ochrony praw twórców sztucznej inteligencji i artystów-ludzi. Obecnie granice między oryginalnością a własnością zacierają się. Toczą się procesy sądowe z udziałem głównych graczy w branży sztucznej inteligencji, więc ciekawie będzie zobaczyć, jak to wszystko się potoczy. W międzyczasie ważne jest, aby przed zatwierdzeniem sprawdzić algorytmy tworzenia i uczenia platformy. Dzięki solidnym partnerstwom sztuczna inteligencja może służyć jako narzędzie usprawniające proces tworzenia muzyki.

Ostatnie przemyślenia na temat generowania muzyki AI

Niezależnie od tego, czy potrzebujesz podkładu do następnego filmu na YouTube, czy też całego utworu z wokalem, muzyka AI to doskonały sposób. Dzięki mocy sztucznej inteligencji możesz generować muzykę AI z podpowiedzi tekstowej, edytować ją i łatwo publikować w ciągu kilku minut. Korzystając z narzędzi takich jak Mubert czy Landr, możesz osiągnąć profesjonalne rezultaty bez żadnego doświadczenia.

Chcesz dowiedzieć się więcej o sztucznej inteligencji? Sprawdź inne nasze posty dotyczące sztucznej inteligencji:

Czym jest sztuka AI? Jak działają generatory sztuki (2023)
Jak stworzyć grafikę AI w 2023 r. (Szczegółowy samouczek)
AI postaci: wszystko, co musisz wiedzieć
Jak korzystać z wypełnienia generatywnego AI w Photoshopie w 2023 r. (szczegółowy samouczek)

Wyróżnione zdjęcie na stronie whiteMocca / Shutterstock.com