Tensorflow 音楽予測

表紙 > プログラミング > Tensorflow 音楽予測

Tensorflow 音楽予測

2024 年 11 月 8 日に公開

ブラウズ：429

Tensorflow music prediction

この記事では、tensorflow を使用して音楽のスタイルを予測する方法を示します。
私の例では、テクノとクラシック音楽を比較します。

コードは私の github にあります:
https://github.com/victordalet/sound_to_partition

I - データセット

最初のステップでは、データセットフォルダーを 1 つ作成し、その中に音楽スタイル用のフォルダーを 1 つ追加する必要があります。たとえば、テクノフォルダーとクラシックフォルダーを 1 つ追加し、そこに wav サウンドを入れます。

II - 電車

引数 max_epochs を指定して train ファイルを作成します。

データセットフォルダー内のディレクトリに対応するコンストラクター内のクラスを変更します。

ロードおよび処理方法では、別のディレクトリから wav ファイルを取得し、スペクトグラムを取得します。

トレーニング目的で、Keras の畳み込みとモデルを使用します。

import os
import sys
from typing import List

import librosa
import numpy as np
from tensorflow.keras.layers import Input, Conv2D, MaxPooling2D, Flatten, Dense
from tensorflow.keras.models import Model
from tensorflow.keras.optimizers import Adam
from sklearn.model_selection import train_test_split
from tensorflow.keras.utils import to_categorical
from tensorflow.image import resize



class Train:

    def __init__(self):
        self.X_train = None
        self.X_test = None
        self.y_train = None
        self.y_test = None
        self.data_dir: str = 'dataset'
        self.classes: List[str] = ['techno','classic']
        self.max_epochs: int = int(sys.argv[1])

    @staticmethod
    def load_and_preprocess_data(data_dir, classes, target_shape=(128, 128)):
        data = []
        labels = []

        for i, class_name in enumerate(classes):
            class_dir = os.path.join(data_dir, class_name)
            for filename in os.listdir(class_dir):
                if filename.endswith('.wav'):
                    file_path = os.path.join(class_dir, filename)
                    audio_data, sample_rate = librosa.load(file_path, sr=None)
                    mel_spectrogram = librosa.feature.melspectrogram(y=audio_data, sr=sample_rate)
                    mel_spectrogram = resize(np.expand_dims(mel_spectrogram, axis=-1), target_shape)
                    data.append(mel_spectrogram)
                    labels.append(i)

        return np.array(data), np.array(labels)

    def create_model(self):
        data, labels = self.load_and_preprocess_data(self.data_dir, self.classes)
        labels = to_categorical(labels, num_classes=len(self.classes))  # Convert labels to one-hot encoding
        self.X_train, self.X_test, self.y_train, self.y_test = train_test_split(data, labels, test_size=0.2,
                                                                                random_state=42)

        input_shape = self.X_train[0].shape
        input_layer = Input(shape=input_shape)
        x = Conv2D(32, (3, 3), activation='relu')(input_layer)
        x = MaxPooling2D((2, 2))(x)
        x = Conv2D(64, (3, 3), activation='relu')(x)
        x = MaxPooling2D((2, 2))(x)
        x = Flatten()(x)
        x = Dense(64, activation='relu')(x)
        output_layer = Dense(len(self.classes), activation='softmax')(x)
        self.model = Model(input_layer, output_layer)

        self.model.compile(optimizer=Adam(learning_rate=0.001), loss='categorical_crossentropy', metrics=['accuracy'])

    def train_model(self):
        self.model.fit(self.X_train, self.y_train, epochs=self.max_epochs, batch_size=32,
                       validation_data=(self.X_test, self.y_test))
        test_accuracy = self.model.evaluate(self.X_test, self.y_test, verbose=0)
        print(test_accuracy[1])

    def save_model(self):
        self.model.save('weight.h5')


if __name__ == '__main__':
    train = Train()
    train.create_model()
    train.train_model()
    train.save_model()

III - テスト

モデルをテストして使用するために、重みを取得して音楽のスタイルを予測するこのクラスを作成しました。

コンストラクターに適切なクラスを追加することを忘れないでください。

from typing import List

import librosa
import numpy as np
from tensorflow.keras.models import load_model
from tensorflow.image import resize
import tensorflow as tf



class Test:

    def __init__(self, audio_file_path: str):
        self.model = load_model('weight.h5')
        self.target_shape = (128, 128)
        self.classes: List[str] = ['techno','classic']
        self.audio_file_path: str = audio_file_path

    def test_audio(self, file_path, model):
        audio_data, sample_rate = librosa.load(file_path, sr=None)
        mel_spectrogram = librosa.feature.melspectrogram(y=audio_data, sr=sample_rate)
        mel_spectrogram = resize(np.expand_dims(mel_spectrogram, axis=-1), self.target_shape)
        mel_spectrogram = tf.reshape(mel_spectrogram, (1,)   self.target_shape   (1,))

        predictions = model.predict(mel_spectrogram)

        class_probabilities = predictions[0]

        predicted_class_index = np.argmax(class_probabilities)

        return class_probabilities, predicted_class_index

    def test(self):
        class_probabilities, predicted_class_index = self.test_audio(self.audio_file_path, self.model)

        for i, class_label in enumerate(self.classes):
            probability = class_probabilities[i]
            print(f'Class: {class_label}, Probability: {probability:.4f}')

        predicted_class = self.classes[predicted_class_index]
        accuracy = class_probabilities[predicted_class_index]
        print(f'The audio is classified as: {predicted_class}')
        print(f'Accuracy: {accuracy:.4f}')

リリースステートメントこの記事は次の場所に転載されています: https://dev.to/victordalet/tensorflow-music-prediction-4i6f?1 侵害がある場合は、[email protected] に連絡して削除してください。

最新のチュートリアルもっと>

なぜ私のCSSの背景画像が現れるのですか？
トラブルシューティング：css背景画像が表示されないチュートリアルの指示にもかかわらず、背景画像が読み込まれない問題に遭遇しました。画像とスタイルのシートは同じディレクトリに存在していますが、背景は空白の白いキャンバスのままです。画像ファイル名を囲む引用： background-ima...

プログラミング 2025-04-27に投稿されました
Google APIから最新のjQueryライブラリを取得する方法は？
Google Apis から最新のjQueryライブラリを取得します。最新バージョンを取得するために、以前は特定のバージョン番号を使用する代替手段がありました。これは、次の構文を使用するものでした。 /latest/jquery.js .jquery.com/jQuery-latest...

プログラミング 2025-04-27に投稿されました
なぜ画像はまだChromeに境界があるのですか？ `border：none;`無効な解決策
cromeの画像境界を削除する 1つの頻繁な問題は、chromeとie9の画像を操作する際に遭遇する頻繁な問題です。と「国境：なし;」 CSSで。この問題を解決するには、次のアプローチを検討してください。スタイル。これを回避するには、次のCSS IDブロックを使用して、目的のパディング...

プログラミング 2025-04-27に投稿されました
Python読み取りCSVファイルUnicodedeCodeError究極のソリューション
unicode decodeエラーがcsvファイルreading ビルトインCSVモジュールを使用してPythonにCSVファイルを読み取ろうとする場合、エラーが発生する： SyntaxError: (unicode error) 'unicodeescape' codec can't...

プログラミング 2025-04-27に投稿されました
Pandas DataFramesで列を効率的に選択するにはどうすればよいですか？
Pandas DataFrames の列の選択データ操作タスクを扱うと、特定の列の選択が必要になります。パンダでは、列を選択するためのさまざまなオプションがあります。数値インデックス列インデックスがわかっている場合、ILOC関数を使用してそれらを選択します。 Pythonインデック...

プログラミング 2025-04-27に投稿されました
CSS「コンテンツ」プロパティを使用してFirefoxが画像を表示しないのはなぜですか？
firefox のコンテンツURLを使用して画像を表示します。これは、提供されたCSSクラスで見ることができます： .googlePic { content: url('../../img/googlePlusIcon.PNG'); margin-top: -6.5%;...

プログラミング 2025-04-27に投稿されました
PHPの2つの等しいサイズの配列から値を同期して反復して印刷するにはどうすればよいですか？
同じサイズの2つの配列の2つの配列から値を同期して反復して印刷する場合、同サイズの2つの配列を使用してselectboxを作成する場合、1つは対応する名前を含む1つを使用して、困難が不適切なsyntaxに起因する可能性があります。アレイ： foreach（$ codes as $ code、...

プログラミング 2025-04-27に投稿されました
Pythonで変動値を検出するために「if」の代わりに「試行」を使用するのはいつですか？
を使用して、「try」vs. "を使用して、python で変数値をテストするために、変数が処理前に値を持っているかどうかを確認する必要がある状況があります。このジレンマは、「if」または「try」コンストラクトを使用するかどうかを決定するときに発生します。あなたの例では、「if」...

プログラミング 2025-04-27に投稿されました
Pythonがハイパースコープサブストリングのスライスにエラーを報告しない理由
範囲外のスライスをサブストリングする：二重性と空のシーケンス Pythonのスライス演算子の要素にアクセスし、「例」[999：999]などのスライス演算子を使用してシーケンスの要素にアクセスします。「例」[9]を使用して個々の要素をインデックス作成するのとは異なり、エラーが発生します...

プログラミング 2025-04-27に投稿されました
C ++の関数またはコンストラクターパラメーターとして排他的なポインターを渡す方法は？
コンストラクターと機能のパラメーターとしてユニークなポインターを管理するユニークなポインター（ unique_ptr この方法は、関数/オブジェクトへの一意のポインターの所有権を転送します。ポインターの内容は関数に移動し、操作後に元のポインターが空になります。：next（std ::...

プログラミング 2025-04-27に投稿されました
なぜsqlalchemyフィルター条項で「flake8」はブールの比較にフラグを立てるのですか？
flake8 Flake8 Flake8フラグをフィルター節のブール比較 SQLのブール比較に基づいてクエリ結果をフィルタリングしようとすると、開発者は「==」の使用に関してFLAKE8から警告を発する可能性があります。一般に、「condがfalse」または「condではない場合：」を...

プログラミング 2025-04-27に投稿されました
eval（）vs。ast.literal_eval（）：ユーザー入力の方が安全なPython関数はどれですか？
の重量eval（）およびast.literal_eval（）in python security をユーザー入力を処理する場合、セキュリティに優先順位を付けることが不可欠です。強力なPython関数であるeval（）は、潜在的な解決策として発生することがよくありますが、懸念は潜在的なリス...

プログラミング 2025-04-27に投稿されました
バージョン5.6.5の前にMySQLのタイムスタンプ列を使用してcurrent_timestampを使用することの制限は何でしたか？
の制限current_timestampがデフォルトまたは5.6.5より前のmysqlバージョンのcurrent_timestampの更新条項の制限は歴史的に、5.6.5以前のmysqlバージョンでは、デフォルトの列のみを制限しました。 current_timestamp句。この制限は、20...

プログラミング 2025-04-27に投稿されました
mysqlエラーを解きます1153：パケットは「max_allowed_packet」制限を超えています
mysqlエラー1153：トラブルシューティングは、「max_allowed_packet」バイトよりも大きなパケットを得ましたは、エニグマティックなmysqlエラー1153に直面しています。エラーを理解するために、犯人を掘り下げて解決策を探索しましょう。あなたの場合、それは...

プログラミング 2025-04-27に投稿されました
ネストされた機能とPythonの閉鎖の違いは何ですか
ネストされた関数とpython の閉鎖と閉鎖は、表面的に閉鎖に似ている一方で、キー差のために根本的に異なります： [非閉ざされた Pythonのネストされた関数は、以下の要件を満たしていないため閉鎖とは見なされません：は、それらは、エンクルの外側に実行される場合、に実行...

プログラミング 2025-04-27に投稿されました