So generieren Sie KI-Musik im Jahr 2023 (Tutorial)
Veröffentlicht: 2023-09-02Haben Sie jemals davon geträumt, professioneller Musiker zu werden, aber Sie haben keinerlei musikalisches Talent? Dank künstlicher Intelligenz (KI) ist es jetzt möglich, mit nur einer Textaufforderung erstaunliche Tracks zu erstellen. KI-Musikgeneratoren sind derzeit der heißeste Trend in der KI, und das aus gutem Grund. Wer kaum oder gar keine musikalischen Fähigkeiten hat, kann atemberaubende Soundtracks erstellen, die er in Social-Media-Beiträgen, YouTube-Videos und mehr verwendet. In diesem Beitrag erklären wir, wie generative KI funktioniert und wie man in wenigen Schritten KI-Musik generiert.
Lass uns eintauchen.
- 1 Was ist KI-Musik?
- 2 Wie funktioniert KI-Musik?
- 2.1 Wiederkehrende neuronale Netze
- 2.2 Generative gegnerische Netzwerke
- 2.3 Generative vorab trainierte Transformatoren
- 2.4 Musikinformationsabruf (MIR)
- 3 Vorteile der Verwendung von KI zur Generierung von Musik
- 4 So generieren Sie KI-Musik
- 4.1 1. Registrieren Sie sich für ein kostenloses Konto
- 4.2 2. Entdecken Sie die Mubert-Schnittstelle
- 4.3 3. Generieren Sie Ihren ersten KI-Musiktitel
- 4.4 4. Laden Sie Ihren Track herunter
- 4.5 5. Listen Sie Ihren Titel auf Mubert Studio auf
- 5 KI-Musikgeneratoren mit Stimme
- 5.1 Landr
- 5.2 Synthesizer V
- 5.3 Widerrufen
- 6 Die Zukunft der KI-Musik
- 7 abschließende Gedanken zur Generierung von KI-Musik
Was ist KI-Musik?
Seit der Einführung der generativen KI im Jahr 2015 sind verschiedene Formen künstlicher Intelligenz entstanden, darunter Text-to-Speech, Verarbeitung natürlicher Sprache und KI-Kunstgeneratoren. Wie diese anderen Formen verwendet KI-Musik Textansagen, um Musiktitel mit unterschiedlichen Instrumenten, Stilen und Genres zu generieren. Es kann auch Kompositionen erstellen, vorhandene Musik modifizieren oder sogar Gesang generieren.
Hier ist ein kurzer Clip, den wir mit Mubert mithilfe einer kurzen Textaufforderung erstellt haben:
Wie funktioniert KI-Musik?
Wie andere Formen generativer KI basiert die zum Erstellen von Musik verwendete Software auf Deep-Learning-Computersystemen, die auf riesigen Mengen an Musikdaten wie Liedern, Künstlern und Genres trainiert werden. Diese Modelle können auf rekurrenten neuronalen Netzen (RNNs), generativen gegnerischen Netzen (GANs), generativen vortrainierten Transformatoren (GPT) oder Musikinformationsabruf (MIR) basieren. Um Ihnen zu helfen, die Bedeutung dieser Begriffe zu verstehen, lassen Sie uns die einzelnen Begriffe aufschlüsseln.
Wiederkehrende neuronale Netze
Rekurrente neuronale Netze (RNNs) sind spezialisierte neuronale Netze, die sich hervorragend für das Verstehen und Verarbeiten von Daten eignen, die in Sequenzen wie Sätzen oder Zeitreihen vorliegen. Sie funktionieren auf ähnliche Weise wie unser Gehirn Informationen verarbeitet. Vereinfacht ausgedrückt können RNNs Ergebnisse in sequentiellen Daten vorhersagen, womit andere KI-Algorithmen Schwierigkeiten haben. RNNs sind besonders nützlich, wenn es um Daten geht, die einer bestimmten Reihenfolge oder einem bestimmten Muster folgen, wie etwa Musik.
Generative gegnerische Netzwerke
Während sie hauptsächlich zur Generierung von Bildern, Avataren und anderen Formen der KI verwendet werden, werden sie auch zur Erstellung von KI-Musik verwendet. GANS besteht aus zwei Teilen, einem Generator und einem Diskriminator, und nutzt diese beiden neuronalen Netze, um Systeme zum Erzeugen von Musik zu trainieren. Der Diskriminator wird verwendet, um zu bestimmen, ob die eingegebene Eingabe echt oder falsch ist. Die Aufgabe des Generators besteht darin, den Diskriminator zu täuschen. Über Tausende von Trainingseinheiten hinweg wird der Generator die Ergebnisse so weit verbessern, dass der Diskriminator keinen Unterschied mehr erkennen kann. Bei der Bilderzeugung ist dies eine relativ einfache Aufgabe. Allerdings gibt es bei der Musik nahezu unbegrenzte Variablen, einschließlich der Instrumente, des Genres, des Stils, des Timings und vielem mehr.
Generative vorab trainierte Transformatoren
Generative vorab trainierte Transformatoren wurden von den Leuten hinter ChatGPT entwickelt und sind fortschrittliche Sprachmodelle, die die Leistungsfähigkeit von Transformatoren und vorab trainiertem Design kombinieren. Sie lernen aus großen Datenmengen und können menschenähnliche Texte, Bilder und Musik erzeugen. Ein auf Musik basierendes GPT-Modell funktioniert durch die Eingabe einer Startsequenz, die es dem Modell ermöglicht, die nächste Note oder den nächsten Akkord in einem Lied vorherzusagen.
Musikinformationsabruf (MIR)
MIR ist ein Forschungsgebiet und die Entwicklung von Techniken, die es Computern ermöglichen, Musikdaten zu analysieren, zu verstehen und Informationen daraus zu extrahieren. Es fungiert als Brücke zwischen Musik und Maschine, indem es KI-Algorithmen verwendet, um musikalische Inhalte zu verarbeiten und zu interpretieren. Mithilfe von MIR können Maschinen beispielsweise lernen, Musik anhand von Audiomerkmalen und Metadaten in Genres, Stimmungen oder andere Klassen zu klassifizieren. Maschinen nutzen diese Informationen dann, um basierend auf Tempo, rhythmischen Mustern, harmonischer Struktur oder Akkorden, um nur einige zu nennen, Originalmusik zu generieren.
Vorteile der Verwendung von KI zur Generierung von Musik
Einer der größten Vorteile von KI-Musikgeneratoren ist ihre Benutzerfreundlichkeit. Nehmen wir zum Beispiel Mubert (wir werden später in diesem Beitrag näher darauf eingehen). Sie schreiben eine kurze Beschreibung der Musik, die Sie erstellen möchten, und innerhalb weniger Minuten haben Sie einen Hintergrundtrack zur Verwendung in Ihren kreativen Projekten. Darüber hinaus bieten diese Programme den zusätzlichen Vorteil einer lizenzfreien Musikproduktion, was bedeutet, dass Sie die generierte Musik überall verwenden können, ohne sich um Verträge oder rechtliche Vereinbarungen kümmern zu müssen.
Ein weiterer wichtiger Faktor, der KI-Musikgeneratoren so attraktiv macht, ist der Preis. Die meisten Plattformen bieten eine kostenlose Nutzung an oder kosten nicht mehr als 20 bis 30 US-Dollar pro Monat, wodurch die Zugänglichkeit selbst für die sparsamsten Kunden gewährleistet ist. Schließlich bieten diese Tools auch ein hohes Maß an Anpassungsmöglichkeiten. Viele KI-Programme wie Landr bieten herunterladbare Apps, mit denen Sie Ihre Musikclips bearbeiten, Gesang hinzufügen und sogar andere Titel einblenden können. Früher erforderten diese Aufgaben umfassende Kenntnisse in Musikbearbeitungsprogrammen, aber dank der Leistungsfähigkeit der KI kann jeder ein meisterhafter Musikkünstler werden.
So generieren Sie KI-Musik
Sie können mehrere Programme verwenden, um KI-Musik zu generieren. In diesem Tutorial zeigen wir Ihnen jedoch, wie das mit Mubert geht.
Mubert ist ein hervorragender Musikgenerator, mit dem Sie personalisierte Musik für Hintergrundtitel erstellen können. Musik kann über die Web-App oder API erstellt werden. Der Hauptvorteil von Mubert ist seine Benutzerfreundlichkeit. Mit einer einfachen Texteingabe können Sie Soundtracks für Spiele, Marketingvideos, Apps und mehr generieren. Es sind sowohl kostenlose als auch kostenpflichtige Pläne verfügbar. Mit der kostenlosen Version können Sie bis zu 25 kostenlose Titel erstellen. Wenn Sie jedoch die kostenlose Version verwenden, müssen Sie die Nutzung durch einen Link zu deren Website zuordnen.
Werfen wir einen Blick auf die Schritte zur Schaffung Ihres ersten Meisterwerks.
1. Registrieren Sie sich für ein kostenloses Konto
Der erste Schritt besteht darin, sich für ein kostenloses Konto anzumelden. Navigieren Sie zunächst zur Mubert-Website und klicken Sie auf die Schaltfläche „Anmelden“ .
Sie können sich mit Google oder Facebook anmelden oder mit Ihrer E-Mail-Adresse und einem Passwort ein neues Konto erstellen. Wenn Sie fertig sind, klicken Sie auf die Schaltfläche „Konto erstellen“ .
Mubert sendet Ihnen per E-Mail einen Bestätigungscode, den Sie angeben müssen, um den Anmeldevorgang abzuschließen.
Sobald Sie den Code abgerufen haben, fügen Sie ihn in das dafür vorgesehene Textfeld ein und klicken Sie auf Konto erstellen .
2. Entdecken Sie die Mubert-Schnittstelle
Sobald Ihr Konto erstellt ist, erhalten Sie einen ersten Blick auf die intuitive Benutzeroberfläche von Mubert. Sie können ganz einfach einen neuen Track generieren (1) oder nach einer Referenz-URL suchen (2), was wir später in diesem Beitrag ausführlich erläutern werden. In der Zwischenzeit können Sie bei Verwendung der Funktion zum Generieren eines Titels eine Textaufforderung eingeben (3), die Dauer des Titels festlegen (4) oder ein Genre, eine Stimmung oder eine Aktivität zum Generieren von Musik auswählen (5). Sobald alle Felder ausgefüllt sind, klicken Sie auf die Schaltfläche „Track generieren“ (6), um die Macht von Mubert zu erleben.
So generieren Sie KI-Musik: Genres
Bevor wir uns mit der Erstellung Ihres ersten KI-Musikstücks aus einer Textaufforderung befassen, werfen wir einen Blick auf die Genres in Mubert. Diese eignen sich hervorragend zum Musizieren in einem bestimmten Stil, beispielsweise Ambient, Klassik oder Rock. Wer Hilfe beim Schreiben einer Eingabeaufforderung benötigt, kann zum Komponieren von Musik vordefinierte Stile wie Genres verwenden. Wenn Sie beispielsweise das EDM- Genre wählen, können Sie einen Clip mit einer starken Grundlinie generieren.
So generieren Sie KI-Musik: Stimmungen
Ebenso können Sie Stimmungen wie schön, ruhig, anregend oder andere auswählen, um den Ton für Ihren Clip festzulegen. Zum Beispiel haben wir diesen 15-Sekunden-Track erstellt, indem wir die Stimmungen „schön “ und „friedlich“ ausgewählt haben.
So generieren Sie KI-Musik: Aktivitäten
Schließlich können Sie einen Aktivitätsstil auf Ihre Musik anwenden, indem Sie eine der Aktivitätsvoreinstellungen auswählen, darunter „Entspannen“, „Fokus“, „Spiel“ oder „Sport“. Sie können beispielsweise die Schlafaktivität auswählen und dann eine Unterkategorie wie Regen auswählen, um realistische Regengeräusche zu erzeugen, die in anderen Projekten verwendet werden können.
Wir weisen darauf hin, dass die gleichzeitige Auswahl mehrerer Kategorien bei Verwendung von Voreinstellungen nicht möglich ist. Wenn Sie beispielsweise eine Stimmung auswählen, können Sie nicht gleichzeitig ein Genre oder eine Aktivität auswählen. Sie können eine Eingabeaufforderung eingeben, wenn Sie Genres, Stimmungen oder Aktivitäten kombinieren möchten.
3. Generieren Sie Ihren ersten KI-Musiktitel
Wir zeigen Ihnen, wie Sie für diesen Schritt KI-Musik mit einer Textaufforderung generieren. Um die Länge unseres Beitrags gering zu halten, verwenden wir eine Dauer von 15 Sekunden. Sie können die Dauer jedoch beliebig wählen. Wie bei anderen generativen KIs ist weniger Text besser. Dies gilt insbesondere für Mubert. Die Verwendung langer, beschreibender Eingabeaufforderungen führt wahrscheinlich zu Verwirrung und führt zu unerwünschten Ergebnissen. Daher ist es am besten, die Eingabeaufforderungen kurz und prägnant zu halten.
Geben Sie zunächst die folgende Eingabeaufforderung in das Textfeld ein: Progressive, Vocal, Tribal, House, Minimal (1). Stellen Sie als Nächstes die Dauer auf 15 Sekunden ein (2) und klicken Sie dann auf „Track generieren“ (3). Sobald Ihr Track fertig ist, wird er direkt unter den Steuerelementen angezeigt. Klicken Sie dort auf das Wiedergabesymbol (4), um eine Vorschau Ihres Titels anzuzeigen. Sie können auf die Schaltfläche „Neu generieren“ klicken, wenn Sie die Spur basierend auf derselben Eingabeaufforderung neu generieren möchten (5). Wenn Sie mit den Ergebnissen zufrieden sind, klicken Sie auf das Download-Symbol , um es in Ihren Downloads zu speichern (6). Denken Sie daran, dass kostenlose Benutzer maximal 25 Titel haben dürfen. Wenn Ihnen das Ergebnis nicht gefällt, löschen Sie es unbedingt (7).
Sie können zwischen Track, Loop, Mix oder Jingle wählen, wenn Sie einen Track neu generieren. Wir wählen die Mix- Einstellung und belassen die Titellänge bei 15 Sekunden.
Hier ist der Originaltrack vor dem Mischen:
Dies ist der Remix-Track:
Suche nach Referenz
Neben der Erstellung von KI-Musik mit einer Textaufforderung oder Voreinstellung können Sie auch die Funktion „Suche nach Referenz“ verwenden. Mit dieser Funktion können Sie eine YouTube-URL eingeben, um im Video enthaltene Titel zu durchsuchen. Zum Ausprobieren nutzen wir zum Beispiel eines unserer eigenen Videos. Geben Sie die YouTube-URL ein (1) und klicken Sie dann auf die Schaltfläche „Tracks suchen“ (2).
Unserer Erfahrung nach dauert die Suche anhand eines Referenzvideos deutlich länger als die Verwendung einer Text-zu-Musik-Eingabeaufforderung, und die Ergebnisse waren gemischt. Das liegt wahrscheinlich daran, dass sich das Tool noch in der Beta-Phase befindet, sodass zweifellos einige Probleme behoben werden müssen.
4. Laden Sie Ihren Track herunter
Wie bereits erwähnt, können Sie Ihre Tracks herunterladen und in Projekten verwenden. Wenn Sie jedoch ein kostenloses Konto verwenden, müssen Sie den Inhalt Mubert zuordnen. Um einen gespeicherten Titel herunterzuladen, navigieren Sie zum Avatarbild oben rechts auf dem Bildschirm und klicken Sie dann auf „Meine Downloads“ .
Von dort aus können Sie auf einen Ihrer Titel klicken, um ihn herunterzuladen.
Wenn das Popup erscheint, klicken Sie auf das Kopiersymbol (1), um den Quellennachweis zu kopieren, und klicken Sie dann auf „Zustimmen und herunterladen“ (2).
Wenn Sie über die Nutzung Ihrer neuen KI-Musik freie Hand haben möchten, können Sie ein kostenpflichtiges Abonnement abschließen. Die Tarife sind preisgünstig, ein Creator-Plan beginnt bei nur 11,69 $ monatlich. Unabhängig vom Abonnement können Sie Ihre Kreation nicht auf Spotify, Apple Music oder ähnliches hochladen. Sie können Ihren Titel jedoch im Mubert Studio verkaufen, worauf wir im nächsten Abschnitt eingehen.
5. Listen Sie Ihren Titel auf Mubert Studio auf
Einer der besten Aspekte von Mubert ist die Möglichkeit, mit den von Ihnen erstellten KI-Musiktiteln passives Einkommen zu generieren. Verwenden von Mubert Studio. Klicken Sie zunächst auf der Startseite unter Mubert Studio auf die Schaltfläche „Beitragen“.
Als Nächstes müssen Sie Ihr Konto einrichten. Geben Sie zunächst Ihre E-Mail-Adresse ein (1) und klicken Sie dann auf die Schaltfläche „Weiter“ (2).
Erstellen Sie ein Passwort (1) und klicken Sie dann erneut auf „Weiter“ (2).
Erstellen Sie Ihren ersten Stream
Sobald Sie sich angemeldet haben, können Sie Ihren ersten Stream erstellen. Klicken Sie zunächst oben links auf der Benutzeroberfläche auf die Schaltfläche „Stream erstellen“.
Wenn der Bildschirm aktualisiert wird, werden mehrere leere Felder angezeigt. Sie füllen diese aus, um Ihren Titel in Mubert's Studio aufzulisten. Geben Sie Ihrem Track zunächst einen Namen (1), definieren Sie die Tonart (2), die Skala (3), die Schläge pro Minute (BPM) (4) und weisen Sie eine Aktivität zu (5). Dies sind die einzigen erforderlichen Felder. Wenn Sie jedoch die übrigen Felder für Stimmung, Wetter, Genre und Tags ausfüllen, können andere Benutzer Ihren Titel bei der Suche finden.
Um die Tonart und BPM für Ihren Track zu finden, navigieren Sie zu Ihren Downloads in Mubert und klicken Sie dann auf den Track, den Sie zum Studio hinzufügen möchten.
Sobald Ihre Parameter festgelegt sind, klicken Sie auf die Schaltfläche „Sample hinzufügen/bearbeiten“, um den Track hinzuzufügen.
Klicken Sie anschließend auf „Hochladen“ , um einen heruntergeladenen Titel von Ihrem Computer hinzuzufügen. Hinweis: Studio erlaubt Ihnen nicht, eine MP3-Datei hochzuladen, daher müssen Sie Ihren heruntergeladenen Titel in eine WAV-Datei konvertieren. Aber kein Grund zur Sorge, Sie können zum Konvertieren Ihrer Dateien eine Open-Source-Software-App wie den VLC Media Player verwenden.
Stellen Sie nach dem Hochladen Ihres Titels sicher, dass BPM und Tonart übereinstimmen, und klicken Sie dann auf die Schaltfläche „Stream-Einstellungen bearbeiten“ .
Abschließend können Sie Ihren Stream live schalten, indem Sie auf die Schaltfläche „Stream speichern“ klicken.
Klicken Sie auf der Hauptseite auf „Meine Streams“ , um Ihre Streams anzuzeigen, zu bearbeiten oder anzuhören.
KI-Musikgeneratoren mit Stimme
Mubert eignet sich hervorragend zum Generieren von Hintergrundtracks, aber was ist, wenn Sie Musik und Gesang wünschen? Es gibt zwei Möglichkeiten, Sprachspuren zu erstellen. Wenn Sie Voiceovers oder andere natürlich klingende Sprache erstellen möchten, können Sie KI-Sprachgeneratoren verwenden. Allerdings enthalten diese im Allgemeinen kein Werkzeug zum Singen von Stimmen. In diesem Fall benötigen Sie ein KI-Audiotool. Eines der Tools auf dieser Liste wird in einem anderen Blogbeitrag vorgestellt. Bei den anderen beiden handelt es sich um herunterladbare Anwendungen, mit denen Sie durch die Kombination von Sprache und Hintergrundmusik Kunstwerke erstellen können.
Landr
Landr ist ein erstklassiges KI-Audiotool, mit dem Sie Ihre Musik über eine intuitive Benutzeroberfläche erstellen, bearbeiten und verteilen können. Für einen günstigen monatlichen Preis von 12 US-Dollar erhalten Sie Zugang zu einem virtuellen Studio, in dem Sie Ihre Kreationen problemlos mischen und mastern können. Landr wird von Plattenkünstlern wie Lady Gaga und Post Malone genutzt und ist die Plattform der Wahl für Profis.
Preis: 12 $ pro Monat.
Holen Sie sich Landr
Synthesizer V
Dreamsonics Synthesizer V ist ein weiteres hervorragendes Programm, wenn Sie Musik mit Gesang erstellen möchten. Sie können Titel mit einer Textaufforderung erstellen und dann Ihre bevorzugte KI-Stimme anwenden. Die App kann kostenlos heruntergeladen werden und enthält Beispiel-KI-Stimmen zum Herumspielen. Wenn Sie sich für die Plattform entscheiden, können Sie eine Vielzahl von KI-Stimmen erwerben. Mit der kostenlosen Version können Sie bis zu 3 Tracks erstellen, sodass Sie genügend Zeit haben, zu entscheiden, ob es Ihren Anforderungen entspricht.
Preise: Kostenlos, mit Paketen ab 79 $.
Holen Sie sich Synthesizer V
Widerrufen
Das letzte Tool für Gesang ist Revocalize. Es funktioniert anders als die anderen Tools auf unserer Liste. Sie können Ihre Stimme aufzeichnen, anstatt Stimmen mit einer Textaufforderung zu generieren. Durch die Magie der KI verändert und verbessert Revocalize Ihre Stimme und ermöglicht Ihnen das Hinzufügen verschiedener Töne, Effekte und Tonhöhen. Noch besser: Sie verwenden einen proprietären Algorithmus, ein UVI-Gesangsmodell (Voice Identity), das Ihre Stimme schützt und sichert. Der Urheberrechtsschutz gibt Ihnen das Recht, es nach eigenem Ermessen zu nutzen. Dies ist eine hervorragende Funktion angesichts aller Urheberrechtsprobleme, mit denen andere KI-Plattformen konfrontiert sind.
Hinweis: Wenn Sie Zugriff auf die kostenlose Version von Revocalize wünschen, müssen Sie sich anmelden und auf einer Warteliste stehen.
Preise: Kostenlos, mit Monatsplänen ab 9 $.
Holen Sie sich Revocalize
Die Zukunft der KI-Musik
Die Zukunft der KI-generierten Musik ist rosig. Manche mögen darin eine Bedrohung für den Arbeitsmarkt oder die menschliche Kreativität sehen, aber das ist falsch. Das heißt, wenn der Gesetzgeber einige rechtliche Schutzmaßnahmen einführen kann, um die Rechte von KI-Erstellern und menschlichen Künstlern zu schützen. Derzeit sind die Grenzen zwischen Originalität und Eigentum fließend. Es sind noch Klagen gegen große Akteure der KI-Branche anhängig, daher wird es interessant sein zu sehen, wie das Ganze ausgehen wird. In der Zwischenzeit ist es wichtig, die Gründungs- und Trainingsalgorithmen einer Plattform zu recherchieren, bevor man sich dazu verpflichtet. Durch solide Partnerschaften kann KI als Werkzeug zur Rationalisierung des Musikerstellungsprozesses dienen.
Abschließende Gedanken zur Generierung von KI-Musik
Egal, ob Sie einen Hintergrundtrack für Ihr nächstes YouTube-Video oder einen kompletten Track mit Gesang benötigen, KI-Musik ist eine hervorragende Möglichkeit, dies zu tun. Dank der Kraft der künstlichen Intelligenz können Sie KI-Musik aus einer Textaufforderung generieren, bearbeiten und in wenigen Minuten problemlos veröffentlichen. Mit Tools wie Mubert oder Landr können Sie ohne Erfahrung professionelle Ergebnisse erzielen.
Möchten Sie mehr über künstliche Intelligenz erfahren? Schauen Sie sich einige unserer anderen KI-Beiträge an:
- Was ist KI-Kunst? Wie Kunstgeneratoren funktionieren (2023)
- Wie man im Jahr 2023 KI-Kunst macht (ausführliche Anleitung)
- Charakter-KI: Alles, was Sie wissen müssen
- So verwenden Sie Photoshop AI Generative Fill im Jahr 2023 (ausführliches Tutorial)
Ausgewähltes Bild über whiteMocca / Shutterstock.com